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© Kompiliersystern und Verfahren zurn rekonfigurierbaren Rechnen 

® Die Erfindung betrifft ein Kompiliersystern und ein Ver- 
fahren zur Erzeugung einer Folge von Programmbefehlen 
zur Verwendung in einer dynamisch rekonfigurierbaren 
Verarbeitungseinheit, die eine interne Hardwareorganisa- 
tion aufweist, die wahlweise unter einer Anzahl von Hard- 
warearchitekturen verandert werden kann, wobei jede 
Hardwarearchttektur Befehle von ein em entsprechenden 
Befehlsatz ausfuhrt. Quelldateien werden zur Ausfuh rung 
mit Hilfe von mehreren Befehlsatzarchitekturen (instructi- 
on set architectures) kompiliert, wie dies durch Rekonfi- 
gurations-Betriebsanweisungen spezifiziert wird. Die Ob- 
jektdateien fassen wahlweise Bitstrome, die Hardwarear- 
chitekturen spezifizieren, die Befehlsatzarchitekturen ent- 
sprechen, mit ausfuhrbarem Code zur Ausfuhrung auf 
den Archhekturen zusammen. 



iff 

to 

CO 

in 
oo 



iu 



BUNDESDRUCKEREI 10.98 802 050/692/1 



22 



DE 198 15 865 A 1 

Beschreibung 

Die vorliegende Erfindung betrifft generell Software fur rekonfigurierbare Computer und insbesondere ein Kompilier- 
system und ein Verfahren zur Erzeugung ausfuhrbarer Dateien zur Verwendung in einer dynamisch rekonfigurierbaren 
5 Verarbeitungseinheit, die eine veranderbare interne Hardwareorganisation aufweist. 

Im Stand der Technik sind Versuche unternommen worden, rekonfigurierbare Gerate bzw. Einheiten zu schaffen. Ein 
erster bekannter Losungsansatz besteht in herunterladbaren (down-loadable) Mikrocode-Geraten, bei denen das Verhal- 
ten bzw. der Betriebsablauf von festen, nicht rekonfigurierbaren Hardwarebetriebsmitteln zur Ausfuhrung von Program- 
men wahlweise verandert werden kann, in dem eine bestimmte Version des Mikrocodes (Prograirimiersprache fur ein 
io Steuerwerk) verwendet wird, der in einen programmierbaren Steuerspeicher geladen wird. Ein Beispiel hierfur findet 
sich in JL. Hennessy und D.A. Paterson, Computer Architecture: A Quantitative Approach, Morgan Kaufmann, 1990. In 
einigen solcher Systerne kann der Mikrocode vom Benutzer nach der Herstellung geschrieben oder verandert werden. 
Siehe beispielsweise W.T. Wilner "Design of the Burroughs B1700* in AFIPS Fall Joint Computer Conference, AHPS 
Press, 1972; W.G. Matheson, "User Microprogrammability in the HP-21MX Minicomputer", in Proceedings of the Se- 
ts venth Annual Microprogramming Workshop, IEEE Computer Society Press, 1974. Weil die zugrundeliegende Compu- 
terhardware in solchen bekannten Systemen nicht selbst rekonfigurierbar ist, zeigen solche Systerne keine optimierte Re- 
chenleistung, wenn man an einen groBen Bereich von Problemtypen denkt. Insbesondere sind solche Systerne generell 
nicht in der Lage, den Datenpfad zu andem, sind durch die GroBe bzw. SpeichergroBe der Ausfiihrungseinheiten be- 
grenzt und sind nur in der Lage, Wechsel-Befehlssatze (alternate instruction sets) fiir dieselbe Hardware zu schaffen. Sol- 
20 che Systerne stellen keinen Einzelkompiler zur Verf ugung, der in der Lage ist, zwei verschiedene Architekturen zu kom- 
pilieren bzw. zu ubersetzen. 

Ein zweiter bekannter Losungsansatz beinhaltet ein System, bei dem die Hardware, die einen Rechenvorgang aus- 
fuhrt, mit Hilfe einer programmierbaren Logik realisiert wird. Es gibt Beispiele hierfur, die feldprogrammierbare Logik- 
schaltungen bzw. feldprogrammierbare Gatetrarrays (FPGAs) von der Stange verwenden (PAM, SPLASH, VCC) und 

25 anwenderprogrammierbare Logik (TERAMAC). Siehe beispielsweise: P. Bertin et al., Programmable Active Memories: 
A Performance Assessment,, Tech. Rep. 24, Digital Paris Research Laboratory, Marz 1993; D.A. Buell et al., Splash 2: 
FPGAs in a Custom Computing Machine, IEEE Computer Society Press, 1996; S. Casselrnan, "Virtual Computing and 
The Virtual Computer", in IEEE Symposium on FPGAs for Custom Computing Macines, IEEE Computer Society Press, 
1994; R. Amerson et al., "Teramac-Configurable Custom Computing", in IEEE Symposium on FPGAs for Custom Com- 

30 puting Machines, IEEE Computer Society Press, 1995. Im allgemeinen erfordern es diese Technologien, daB eine An- 
wendung bzw. Applikation hinsichtlich der Hardwarebeschreibung spezifiziert wird, was entweder in Form einer sche- 
matischen Beschreibungssprache oder unter Verwendung einer Hardware-Beschreibungssprache, wie beispielsweise 
VHDL, erfolgt, anstatt daB man Software fiir einen Computer schreibt, der durch FPGAs festgelegt wird. Beispielsweise 
wird ein PAM programmiert, indem man ein C-H-Programrn schreibt, das eine Netzliste erzeugt, die die Konfiguration 

35 und Architektur der Gatter bzw. Schaltelemente (Gate) beschreibt Ein Applikationsentwickler spezifiziert eine Daten- 
struktur, die eine Hardwarebeschreibung zur Umsetzung der Applikation beschreibt, anstatt daB er eine Spezifizierung 
eines Applikationsalgorithmusses kompiliert. SPLASH wird auf eine der folgenden drei Arten programmiert: 1) Ein 
schematisches Erfassungspaket (schematic capture package) zum Aufbauen einer Hardwarespezifizierung, basierend auf 
einem Schaltschema bzw. schematischen Diagramm; 2) einer Hardware-Beschreibungssprache (wie beispielsweise 

40 VHDL), die mit einem Synthese-Paket gekoppelt ist, das VHDL in einfache Gate-Anweisungen (primitives) ubersetzt; 
oder 3) einer DBC, d. h. einer C-Untersprache, die in Gate-Beschreibungen kompiliert wird. TERAMAC wird mit Hilfe 
eines schematischen Erfassungspakets oder einer Hardware-Beschreibungssprache programmiert. Keines dieser Pro- 
gramrnierverfahren beschreibt Algorithmenschritte; statt dessen sorgen sie fur einen Mechanismus zur Spezifizierung 
von Hardware- Architekturen. 

45 Ein dritter bekannter Losungsansatz beinhaltet rekonfigurierbare Computer, die Softwareprogramme ausfiihren. Der 
RISC-4005-Prozessor und derHokie-Prozessor realisieren Standard-Mikroprozessoren innerhalb von FPGAs. Der RISC 
4005 ist im wesentlichen die Demonstration einer eingebetteten (embedded) zentralen Prozessoreinheit (CPU) innerhalb 
eines kleinen Abschnittes eines FPGAs, dessen weitere Betriebsmittel (resources) einigen Coprozessor-Funktionen zu- 
geordnet sind. Hokie wird als Lerniibung fur Informatikstudenten oder Elektrotechnikstudenten verwendet. Eine Be- 

50 fehlsatzarchitektur (instruction set architecture; ISA) wird vor der Kornpilierung und Ausfuhrung des Programmes aus- 
gewahlt und diese Befehlsatzarchitektur wird dann fortwahrend verwendet. AuBerdern wird der Bitstrom fur den Prozes- 
sor separat von der Software abgespeichert, die dieser ausfiihrt Ad hoc- Verfahren werden verwendet, um sicherzustel- 
len, daB ein korrekter Bitstrom geladen wird. Siehe beispielsweise P. Athanas und R. Hudson, "Using Rapid Prototyping 
to Teach the Design of Complete Computing Solutions", in IEEE Symposium on FPGAs for Custom Computing Machi- 

55 nes, IEEE Computer Society Press, 1996. Diese Systerne sorgen nicht fiir eine Laufzeit-Rekonfigurierung (wahrend der 
Ausfuhrung des Prograrnm). 

Bei einem weiteren bekannten, rekonfigurierbaren Computer handelt es sich um den dynamischen Befehlsatz-Compu- 
ter (Dynamic Instruction Set Computer; DISC), der eine rekonfigurierbare Prozessoreinheit verwendet Siehe beispiels- 
weise M.J. Wirthlin und BL. Hutchings, "A Dynamic Instruction Set Computer", in IEEE Symposium on FPGAs for 

60 Custom Computing Machines, IEEE Computer Society Press, 1995; D.A. Clark und B.L. Hutchings, "The DISC Pro- 
gramming Environment", in IEEE Symposium on FPGAs for Custom Computing Machines, IEEE Computer Society 
Press, 1996. Die Ausfuhrung und Konfiguration der FPGA der DISC-Prozessoreinheit wird mit Hilfe eines Mikrocon- 
trollers gesteuert, der ebenfalls in Form eines FPGAs realisiert ist. Der Mikrocontroller wird in einem Dialekt der C-Pro- 
grammiersprache programmiert. Der Kompiier bzw. das Ubersetzungsprogramm fur diesen C-Dialekt erkennt, daB ge- 

65 wisse Programmanweisungen durch entsprechende Hardware-Konfigurationen der Verarbeitungseinheit ausgefuhrt wer- 
den sollen und sendet einen Mikrocontroller-Code aus, der veranlaBt, daB der richtige Konfigurations-Bitstrom wahrend 
der Ausfuhrung des Programms in die Verarbeitungseinheit geladen wird. Der Fachmann auf diesem Gebiet wird erken- 
nen, daB der Mikrocontroller seinerseits einen festen Befehlssatz aufweist und daB der Kompiier diesen festen Befehls- 
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satz kompiliert bzw. ubersetzt. Es bestehen mehrere Nachteile hinsichtlich dieser von einem DISC venvendeten Archi- 
tektur. Weil der Mikrocontroller fest bzw. statisch ist, kann dieser nicht optimiert werden, urn verschiedene Arten von 
Verarbeitungseinheiten zu steuern. Die Konfi gurations-Bitstrome werden in extemer Hardware auBerhalb des Speicher- 
platzes des Mikrocontrollers gespeichert, weshalb das System nicht selbst-enthaltend ist. AuBerdem offenbaren die vor- 
stehend im Wege der Bezugnahme in dieser OfFenbarung mit beinhalteten Dokumente nicht, wie ein DISC zura Parallel- 5 
rechnen, zur globalen Signalisierung bzw. systemweiten Dateniibermittlung und zum Takten oder zur Handhabung von 
Interrupts bzw. Unterbrechungsanweisungen verwendet werden konnte. Schliefilich werden neue Befehle nur als Einzel- 
groBen spezifiziert Der Kompiler sendet nur Befehle fur einen Befehlssatz aus, laBt es jedoch zu, daB einzelne Befehle 
vom Programmierer hinzugefugt werden. Jede Konfigurierung der Verarbeitungseinheit ist ein einzelner Befehl in Form 
von Hardware, der von dern Programmierer zur Verfugung gestellt wird, wodurch die mogliche Flexibility einge- 10 
schrankt wird. 

Ein vierter bekannter Losungsansatz besteht darin, Systeme zu mischen, wobei verschiedene Teiie des Algorithmus 
bzw. Rechenvorgangs auf verschiedene Komponenten bzw. Elemente des Systems abgebildet werden. Ein bekanntes Sy- 
stem bildet einen Algorithmus, der in einem erweiterten C-Dialekt ausgedruckt ist, auf eine gemischte FPGA/DSP-Ar- 
chitektur ab. Der Benutzer markiert ausdriicklich Abschnitte des Eingabeprogramms zur Zuordnung zum DSP, wahrend 15 
der Rest des Codes in Gates zur FPGA-Realisierung hinein kompiliert wird. Solche Systeme erfordem spezialisierte 
Werkzeuge bzw. Tools, weil sie eine nicht ubliche Syntax fur ISA-Anderungen verwenden. AuBerdem ist der Betrieb sol- 
cher Systeme rniihsam, was an der Verwendung von Netzlisten zur FPGA-Spezifizierung von Abschnitten des Pro- 
. gramms liegt. Solche Programme schaffen keine tatsachliche Hardware-Rekonfigurierung, sondem sorgen lediglich fur 
die Fahigkeit zur Abbildung auf ein anderes Teil der Hardware. 20 

In gleicher Weise verwenden einige Systeme einen Standard-Mikroprozessor mit einigen konfigurierbaren Logik-Be- 
triebsmitteln. Diese Betriebsmittel (Resourcen) werden verwendet, um spezielle Befehle bzw. Instruktionen zu realisie- 
ren, die die Ausfuhrung von bestimmten Programmen beschleunigen. Siehe beispielsweise R. Razdan und M.D. Smith, 
M A High-Performance Microarchitecture with Hardware-Programmable Functional Units", in Proceedings of the 
Twenty-Seventh Annual Microprogramming Workshop, IEEE Computer Society Press, 1994. Solche Systeme werden 25 
typischerweise als Zentralprozessoreinheit (CPU) realisiert, und zwar mit einem Abschnitt des Silizium-Chips, der ver- 
wendet wird, um einen FPGA zu realisieren. Die CPU besitzt einen festen bzw. fixierten Datenpfad, mit dem die FPGAs 
verbunden sind. Der Kompiler kombiniert ausgewahlte Assembler-Codesequenzen in Einzelbefehlanweisungen zur 
Ausfuhrung durch ein FPGA. Jedoch arbeiten solche Systeme generell nur auf Ebenen eines bestehenden Assernbler- 
Sprachcodes und erfordem eine angrenzende, feste Befehlsatzarchitektur (nachfolgend als ISA oder auch IS-Architektur 30 
bezeichnet) als Ausgangspunkt. AuBerdem halten solche Systeme generell keine Laufzeit-Rekonfigurierung bereit. 
Schliefilich sind solche Systeme nicht weit anwendbar und sorgen ublicher Weise nicht fur eine deutliche Geschwindig- 
keitsverbesserung im Vergleich zu anderen herkommlichen Systemen. 

Obwohl die zuvor genannten Systeme jeweils ein gewisses Niveau fur die Rekonfigurierbarkeit von Hardware schaf- 
fen, beschreibt keines von diesen ein Verfahren oder eine Vorrichtung zur Zusammenfassung von binaren Maschinen- 35 
sprache-Befehlen und von Daten gemeinsam mit den Hardware- Konfigurierungen, die notwendig sind, um die Maschi- 
nenbefehle in der in diesem Patent beanspruchten Art und Weise auszufuhren. AuBerdem offenbaren die bekannten Sy- 
steme weder eine Mehrfacharchitektur-ISA-Rekonfiguration auf der Ebene der Granularitat, die vergleichbar zu RISC- 
oder CISC-Befehlen ist, die hierin beansprucht werden, noch Kompilierungsverfahren innerhalb der C-Sprachensyntax 
zum Ausfuhren auf dynamisch rekonfigurierten IS-Architekturen, wie diese hierin beansprucht werden. 40 

ErfindungsgemaB wird ein System und ein Verfahren zur Kompilierung von Quellcode geschafifen, der beispielsweise 
in C oder Pascal geschrieben ist, um ausfuhrbare Dateien bzw. Programme zur Verwendung in einer dynamisch rekonfl- 
gurierbaren Prozessoreinheit zu erzeugen, die eine wahlweise veranderbare interne Hardwareorganisation aufweist. Bei 
einer Ausfuhrungsform konnen erfindung sgernaB Maschinenbefehle und Daten gemeinsam mit Hard ware- Konfiguratio- 
nen zusammengefaBt werden, welche erforderlich sind, um die Maschinenbefehle auszufuhren. In der rekonfigurierbaren 45 
Architektur besteht jeder einzelne Prozessor beispielsweise aus: Einer rekonfigurierbaren Prozessor-Hardware, wie bei- 
spielsweise einem vollstandig FPGA-basierten Prozessor, einem Datenspeicher und einem Programmspeicher, einer Par- 
allel- Verbindungseinheit und einem wiederbeschreibbaren Speicher fur FPGA-Konfigurationsbits. Durch dynamisches 
Laden von FPGA-Konfigurationsbitstromen realisiert die vorliegende Erfindung einen dynamischen ISA-Computer, der * 
eine hohe Leistungsfahigkeit erreicht, in dem ISAs verwendet werden, die fur spezielle Phasen der Ausfuhrung der App- 50 
likadon optimiert sind. 

Bei der erfindungsgemaBen Architektur werden Applikationen als Software zur Verfugung gestellt, wird Hardware in 
der Form von Schaltungen (ein zentrales Service-Modul, Prozessormodule, Eingabe/Ausgabe-Module (I/O)) sowie Bit- 
strome fur Befehlsatzarchitekturen (ISAs) bereitgestellt, die auf den FPGAs des Prozessormoduls beheimatet sind. Ein 
ISA bzw. eine IS-Architektur ist ein primitiver Satz von Befehlen, der dazu verwendet werden kann, einen Computer zu 55 
programmieren. Applikationssoftware wird mit Hilfe von FPGAs ausgefuhrt, die als ISAs auf den Prozessormodulen 
konfiguriert sind. 

Die vorliegende Erfindung beschreibt ein System, das ausgelegt ist, so daB FPGA-Konfiguradonsbitstrome statisch 
wahrend der Kompilierung mit dem Programm verbunden bzw. verknupft werden konnen, das diese ausfuhrt, und daB 
diese zum dynamischen Schalten von ISAs und/oder FPGA-Applikationselementrealisierungen unabhangig und in Echt- 60 
zeit programmiert werden konnen. 

Die ISAs fuhren Programmbefehle aus, die in RAM 133 gespeichert sind. Diese Programmbefehle umfassen wahl- 
weise eine oder mehrere Rekonfigurations-Ubersetzungsanweisungen (reconfiguration directives). Bei Auswahl einer 
Rekonfigurations-Ubersetzungsanweisung bzw. Rekonfigurations-Betriebsanweisung wird die Hardware rekonfiguriert, 
um fur eine optimierte Realisierung einer bestimmten Befehlsatzarchitektur zu sorgen. Zusatzlich zu ihrer spezifischen 65 
Funkdonalitat umfaBt jede ISA einen Befehl oder eine tjbersetzungsanweisung, der bzw. die veranlaBt, daB eine andere 
ISA in den rekonfigurierbaren Prozessor geladen wird, so daB die Ausfuhrung der Software anschlieBend unter Verwen- 
dung der neuen ISA fortfahrt. 
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Weil die Speicherstelle der ISA-Bitstrome im Speicher ein Argument fur den Rekonfigurationsbefehl darstellt, wird 
diese Speicherstelle vorzugsweise zum Zeitpunkt der Verbindung (link) oder des Ladens bestimrnt. was auch fur die 
Speicherstellen fur Funktions- Aufrufziele und - Variablen gilt. Ebenso wie fur diese Funktionen und Variablen hat es sich 
als wunschenswert herausgestellt, symbolische Namen far die Adressen eines Bitstroms zu verwenden. Die vorliegende 
5 Erfindung verwendet ein Objektdatei-Format, das die Vorstellung einer ausfuhrbaren Software auf ISA-Bitstrome erwei- 
tert. Daraus resultieren einige Vorteile, wie beispielsweise: 

- Tools bzw. Werkzeuge konnen leicht aufgebaut bzw. ersteilt werden. Weil die Rekonfigurierung als ein Befehl 
und Bitstrome als Daten behandelt wird, konnen standardmaBige Software- Verbindungsverfahren eingesetzt wer- 

10 den, urn softwaregesteuerte Hardwareanderungen mit den erforderlichen Bitstrom zu binden. Keine neue Software- 

technologie uber die Bitstrom-als-Daten-Abstraktion muB erzeugt werden. 

- Flexibility beim Laden. Indem Rekonfigurationsdaten auf einen Teil des Ausfuhrbaren isoliert werden, wird die 
Fahigkeit Konfigurationen in geschiitzte Bereiche des Speichers zu laden, vereinfacht. Mit Gesichtspunkten der 
Speicherausrichtung wird man auf strukturierte Weise leicht fertig, wie nachfolgend ausfuhrlicher beschrieben wer- 

15 den wird. 

- Das Laden wird vereinfacht. Alle Daten, die erforderlich sind, um das Programm auszufuhren, werden in einer 
einzigen Datei aufbewahrt, so daB keine Ladezeit-Identifikation und keine Lokalisierung von Bitstromen ausgefuhrt 
zu werden braucht, falls das Ausfuhrbare bzw. das Programm statisch verbunden wird 

- Das Konfigurationsmanagement wird vereinfacht. Nur eine einzige Datei braucht zur gleichen Zeit beibehalten 
20 werden, sobald ein Programm gebunden worden ist. Dies vereinfacht die \fcrgehensweise zur Verteilung von App- 

likationen auf einzelne Gerate und entfernte Stellen. 

Nachfolgend wird die Erfindung in beispielhafter Weise und unter Bezugnahme auf die Zeichnungen beschrieben, in 
denen: 

25 Fig, 1 ein Blockschema der Hardwarekomponenten einer dynamisch rekonfigurierbaren Rechenarchitektur ist; 
Fig, 1A ein Blockschema eines erfindung sgemaBen Prozessormoduls ist; 

Fig. IB und 1C Blockschema einer Systernarchitektur zur Realisierung der Erfindung sind, die ein Beispiel fur die Re- 
konfiguration eines FPGAs zeigen; 

Fig. 2 ein Beispiel fur ein Prograrnrnlisting ist, das Rekonfigurations-Ubersetzungsanweisungen enthalt; 
30 Fig. 3 ein FluBdiagramm fur ein Gesamt-Kompilierverfahren ist, das von einem Kompiler bzw. Ubersetzungspro- 
gramm zum dynamisch rekonfigurierbaren Rechnen ausgefuhrt wird; 

Fig. 3A und 3B ein FluBdiagramm von bevorzugten Kompiliervorgangen sind, die von einem Kompiler zum dyna- 
misch rekonfigurierbaren Rechnen ausgefuhrt werden; 

Fig. 3C ein FluBdiagramm von weiteren Kompiliervorgangen ist, die von einem Kompiler zum dynamisch rekonfigu- 
35 rierbaren Rechnen ausgefuhrt werden; 

Fig. 4 ein Blockschema eines Kompiliersystems gemaB der vorliegenden Erfindung ist; 

Fig. 5 ein Schema eines Objektdateiformats aus dem Stand der Technik ist; 

Fig. 6 ein FluBdiagramm fur ein Verfahren zum Erhalten eines Programmzustands gemaB der vorliegenden Erfindung 
ist; 

40 Fig. 7 ein FluBdiagramm fur ein Verfahren zur strukturierten Rekonfiguration gemaB der vorliegenden ist; und 

Fig. 8A, 8B und 8C Diagramme von Stapelinhalten wahrend einer strukturierten Rekonfiguration gemaB der vorlie- 
genden Erfindung darstellen. 

Fig. 9 ein Blockdiagramm einer bevorzugten Ausfiihrungsform eines Systems fur ein skalierbares, paralleles, dyna- 
misch rekonfigurierbares Berechnen, gemaB der Erfindung; 
45 Fig. 10 ein Blockdiagramm einer bevorzugten Ausfiihrungsform einer S-Einrichtung gemaB der Erfindung; 
Fig. 1 1 A ein beispielhaftes Programmauflisten, das Rekonfigurationsanweisungen enthalt; 

Fig. 11B ein Ablaufdiagramm von herkommlichen Kompilieroperationen, die wahrend der Kompilation einer Folge 
von Programmbefehlen durchgefuhrt worden sind; 

Fig. 11C und 11D ein Ablaufdiagramm von bevorzugten Kompilieroperationen, welche rnittels eines Kompilierers fiir 
50 ein dynamisch rekonfigurierbares Berechnen durchgefuhrt worden sind; 

Fig. 12 ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer dynamisch rekonfigurierbaren Verarbeitungs- 
einheit der Erfindung; 

Fig. 13 ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer Befehlsabrufeinheit der Erfindung; 

Fig. 14 ein Zustandsdiagramm, das eine bevorzugte Gruppe von Zustanden zeigt, die durch eine Befehlszustands-Ab- 
55 laufsteuereinheit der Erfindung gestiitzt sind; 

Fig. 15 ein Zustandsdiagramm, das eine bevorzugte Gruppe von Zustanden zeigt, welche durch Unterbrechungslogik 
der Erfindung getragen sind; 

Fig. 16 ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer Datenoperationseinheit der Erfindung; 

Fig. 17A ein Blockdiagramm einer ersten beispielhaften Ausfuhrungsform der Datenoperationseinheit, welche durch 
60 die Ausfiihrung einer universellen AuBenschleifen-Befehlssatz-Architektur konfiguriert ist; 

Fig. 17B ein Blockdiagramm einer zweiten beispielhaften Ausfuhrungsform der Datenoperationseinheit, welche fur 
die Verwirklichung einer Innenschleifen-Befehlssatz-Architektur konfiguriert ist; 

Fig. 18 ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer Adressenoperationseinheit der Erfindung; 

Fig. 19A ein Blockdiagramm einer ersten beispielhaften Ausfuhrungsform der Adressenoperationseinheit, welche fur 
65 die Verwirklichung einer universellen AuBenschleifen-Befehlssatz-Architektur konfiguriert ist; 

Fig. 19B ein Blockdiagramm einer zweiten beispielhaften Ausfuhrungsform der Adressenoperationseinheit, welche 
fiir die Verwirklichung einer Innenschleifen-Befehlssatz-Architektur konfiguriert ist; 

Fig. 20A ein Diagramm, das eine beispielhafte Zuordnung von rekonfigurierbaren Hardware-Ressourcen zwischen 
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der Befehlsabrufeinheit, der Datenoperationseinheit und der Adressenoperationseinheit fur eine AuBenschleifen-Be- 
fehlssatz-Architektur zeigt; 

Fig. 20B ein Diagramm einer beispielhaften Zuordnung von rekonfigurierbaren Hardware-Ressourcen zwischen der 
Befehlsabfrageeinheit der Datenoperationseinheit und der Adressenoperationseinheit fur eine Innenschleifen-Befehls- 
satz-Architektur; 5 

Fig, 21 ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer T-Einrichtung der Erfindung; 

Fig. 22 ein Blockdiagramm einer Verbindungs-Ein-/Ausgabeeinheit der Erfindung; 

Fig. 23 ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer Ein-/Ausgabe-T-Einrichtung der Erfindung; 

Fig. 24 ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer universellen Verbindungsmatrix der Erfindung, 
und io 

Fig. 25A und 25B ein Ablaufdiagramm eines bevorzugten Verfahrens fur ein skalierbares, paralleles, dynarnisch re- 
konfigurierbares Berechnen gemafi der Erfindung. 

Die vorliegende Erfindung ist auf ein Kompiliersystem und ein Verfahren zur Erzeugung ausfuhrbarer Dateien zur 
Verwendung bei einer dynarnisch rekonfigurierbaren Prozessoreinheit gerichtet, deren Hardware-Konfiguration nachfol- 
gend insbesondere anhand der Fig. 9 bis 25B beschrieben wind. 15 

In Fig. 1 ist ein Blockschema eines skalierbaren, parallelen, dynarnisch rekonfigurierbaren Computers 10 zum Aus- 
fuhren von Objektdateien gezeigt, die gemaB der vorliegenden Erfindung erzeugt wurden. Der Computer 10 umfaBt vor- 
zugsweise rnindestens eine S-Einrichtung 12, eine T-Einrichtung 14, die jeder S-Einrichtung 12 entspricht, eine Mehr- 
zweck- Verbindungsmatrix (General Purpose Interconnect Matrix; GPI-Matrix) 16, rnindestens eine Eingabe-/Ausgabe- 
T-Einrichtung 18, eine oder mehrere Eingabe-/Ausgabeeinrichtungen 20 und eine Master-Zeitbasiseinheit 22. Bei der be- 20 
vorzugten Ausfuhrungsform umfaBt der Computer 10 mehrere S-Einrichtungen 12 und somit auch mehrere T-Einrich- 
tung en 14 und auBerdem mehrere Eingabe-/Ausgabe-T-Einrichtungen 18 und mehrere Eingabe-/Ausgabeeinrichtungen 
20. 

Jede der S-Einrichtungen 12, T-Einrichtungen 14 und Eingabe-/Ausgabe-T-Einrichtungen 18 hat einen Mastertaktein- 
gang, der mit dem Taklausgang der Masterzeitbasiseinheit 22 verbunden ist. Jede S-Einrichtung 12 hat einen Eingang 25 
und einen Ausgang, der mit ihrer entsprechenden T-Einrichtung 14 verbunden ist. Zusatzlich zu dem Eingang und dem 
Ausgang, die mit der entsprechenden S-Einrichtung 12 verbunden sind, weist jede T-Einrichtung 14 einen Wegsteue- 
rungseingang (routing input) und einen Wegsteuerungsausgang auf, die mit der GPI-Matrix 16 verbunden sind. Dement- 
sprechend hat jede Eingabe-/Ausgabe-T-Einrichtung 18 einen Eingang und einen Ausgang, die mit einer Eingabe-/Aus- 
gabeeinrichtung 20 verbunden sind, sowie einen Wegsteuerungseingang und einen Wegsteuerungsausgang, der mit der 30 
GPI-Matrix 16 verbunden ist. 

Bei jeder S-Einrichtung 12 handelt es sich um einen dynarnisch rekonfigurierbaren Rechner. Die GPI-Matrix 16 stellt 
ein paralleles Punkt-zu-Punkt-Verbindungsmittel bzw. ein paralleles Maschen- Verbindungsmittel dar, das die Kommuni- 
kation zwischen den T-Einrichtungen 14 erleichtert. Der Satz von T-Einrichtungen 14 und die GPI-Matrix 16 bilden ein 
paralleles Punkt-zu-Punkt- Verbindungsmittel fur einen Datentransfer zwischen Speichern, die der S-Einrichtung 12 zu- 35 
geordnet sind. In ahnlicher Weise bilden die GPI-Matrix 16, der Satz von T-Einrichtungen 14 und der Satz von Eingabe- 
/Ausgabe-T-Einrichtungen 18 ein paralleles Punkt-zu-Punkt- Verbindungsmittel fur einen Eingabe-/Ausgabetransfer zwi- 
schen S-Einrichtungen 12 und jeder Eingabe-AAusgabeeinrichtung 20. Die Master-Zeitbasiseinheit 22 umfaBt einen Os- 
zillator, der jeder S-Einrichtung 12 und jeder T-Einrichtung 14 ein Master-Taktsignal zur Verfugung stellt. 

In einer beispielhaften Ausfuhrungsform ist jede S-Einrichtung 12 durch Verwendung eines Xilinx XC4013 (Xihnx, 40 
Inc., San Jose, CA) feldprogrammierbaren Gate- Arrays (FPGA) bzw. Logikanordnung ausgefuhrt, das mit einem 64 MB 
Direktzugriffsspeicher (RAM) verbunden ist. Jede T-Einrichtung 14 ist durch Verwendung von annahemd 50% der re- 
konfigurierbaren Hardware-Betriebsmittel in einera Xilinx XC401 3 FPGA ausgefuhrt, ebenso jede Eingabe-/Ausgabe-T- 
Einrichtung 18. Die GPI-Matrix 16 ist als ein ringformiges Verbindungsmaschennetz ausgefuhrt. Die Master-Zeitbasis- 
einheit 22 ist ein Taktoszillator, der mit einer Taktverteilungsschaltung verbunden ist, um fur eine systemweite Frequenz- 45 
referenz zu sorgen, wie nachfolgend anhand der Fig. 9 bis 25B beschrieben wird. Vorzugsweise iibertragen die GPI-Ma- 
trix 16, die T-Einrichtungen 14 und die Eingabe-/Ausgabe-T-Einrichtungen 18 Information entsprechend dem Punkt-zu- 
Punkt-Protokoll des ANSI/IEEE-Standard 1596-1992, wodurch ein skalierbares koharentes Interface (SCI) definiert ist. 

In Fig. 1 A ist ein Blockschema eines Prozessormoduls 130 gezeigt, das in einer Ausfuhrungsform der vorliegenden 
Erfindung verwendet wird. Der S-Einrichtung s-FPGA 12 ist mit einem zugeordneten bzw. reservierten Bitstromspeicher 50 
132 und einem Programm-/Datenspeicher 133, einer oder mehreren T-Einrichtungen 14 und einer Takterzeugungsschal- 
tung verbunden, wie beispiels weise einen Taktgenerator 131, um ein Prozessormodul 130 zu bilden. Das Modul 130 ist 
mit anderen, vergleichbaren Modulen uber die T-Einrichtungen 14 in einer solchen Art und Weise verbunden, die einen 
Parallelbetrieb erleichtert. Der Programnv/Datenspeicher 133 speichert Prograrnmbefehle und ist in Form eines ublichen 
RAMs realisiert. Der Bitstromspeicher 132 speichert Bitstrome, die die FPGA-Konfigurationen beschreiben. In einer 55 
Ausfuhrungsform ist der Programm-/Datenspeicher 133 als dynamisches RAM (DRAM) implementiert und der Bit- 
stromspeicher 132 als statisches RAM (SRAM). 

In den Fig. IB und 1C sind Beispiele fur eine FPGA-Rekonfiguration gezeigt, um ISAs in rekonfigurierbarer Archi- 
tektur zu realisieren. Die Figuren zeigen Blockschema einer Systemarchitektur zur Realisierung der vorliegenden Erfin- 
dung, wobei die S-Einrichtungs-FPGA 12 umprogrammiert ist, so daB sie eine arithmetische Logikeinheit (ALU) 143 in 60 
Fig. IB umfaBt sowie einen finiten Impulsantwortfilter (FIR) 148 in Fig. 1C. Ein Bitstrom-RAM 132 und ein Programm- 
/Daten-RAM 133 ist vorgesehen. DerSpeicherbus 149 halt einen Kommunikationskanal zwischen dem S-Einrichtungs- 
FPGA 12 und RAM 132 und 133 bereit. Die FPGA-Konfigurationshardware 140 ermoglicht die Rekonfiguration des S- 
Einrichtungs-FPGAs 12 entsprechend den ISA-Bitstromen vom Bitstrom-RAM 132. Konfigurationen des S-Einrich- 
tungs-FPGA 12 umfassen beispiels weise Datenregister bzw. Datenspeicher 141, AdreBregister 142, einen Registermul- 65 
tiplexer 144 und ein Speicherdatenregister 145. Jede oder alle dieser Komponenten kann modifiziert oder in anderen 
Konfigurationen entfemt werden, was von dem Bitstrom abhangt. Beispielsweise taucht Alu 143 in der in Fig. IB ge- 
zeigten Konfiguration auf, ist aber in der Konfiguration aus Fig. 1C durch den FIR-Filter 148 ersetzt. 
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Rekonfigurations-tJbersetzungsanweisungen 

Vorzugsweise speichert der Computer 10 Programmbefehle in RAM wahlweise, und zwar einschlieBlich von Rekon- 
figurations-Ubersetzungsanweisungen zur Rekonfigurierung von Computer 10, indem die Konfigurauon der S-Einrich- 
5 tung 12 geandert wird. In Fig. 2 ist ein beispielhaftes Programmlisting 50 gezeigt, das einen Satz von AuBenschleifen- 
abschnitten 52, einen ersten Innenschleifenabschnitt 54, einen zweiten Innenschleifenabschnitt 55, einen dritten Innen- 
schleifenabschnitt 56, einen vierten Innenschleifenabschnitt 57 und einen funften Innenschleifenabschnitt 58 umfaBt. 
Wie der Fachmann weiB, verweist der BegrifF "Innenschleife" auf einen iterativen Abschnitt eines Programms, der dafur 
verantwortlich ist, einen ganz bestimmten Satz von verwandten Operationen auszufuhren; und der Begriff "AuBen- 

10 schieife" verweist auf die Abschnitte eines Programms, die hauptsachlich dafur verantwortlich sind, Mehrzweck-Opera- 
tionen bzw. universelle Operationen und/oder eine Ubertragungssteuerung von einem Innenschleifenabschnitt zum an- 
deren durchzufiihren. Im allgerneinen fuhren die Innenschleifenabschnitte 54 bis 58 eines Programms spezifische Ope- 
rationen an moglicherweise groBen Datensatzen durch. Eine oder mehrere der Rekonfigurations-Ubersetzungsanweisun- 
gen kann einem vorgegebenen Innenschleifenabschnitt 54, 55, 56, 57 oder 58 zugeordnet sein, so daB sich eine geeignete 

15 ISA im Kontext befinden wird, wenn der Innenschleifenabschnitt ausgefuhrt wird. Im allgerneinen werden fur ein belie- 
biges vorgegebenes Programm die AuBenschleifenabschnitte52 des Programmlistings 50 eine Vielzahl von Mehrzweck- 
Befehlsarten umfassen, wahrend die Innenschleifenabschnitte 54, 56 des Programmlisungs 50 aus vergleichsweise we- 
nig Befehlsarten bestehen werden, die dazu verwendet werden, einen spezifischen Satz von Operationen auszufuhren. 
In einer beispielhaften Programmauflistung 50 erscheint eine erste Rekonfigurations-Ubersetzungsanweisung zu Be- 

20 ginn des ersten Innenschleifenabschnitts 54 und erscheint eine zweite Rekonfigurations-Ubersetzungsanweisung am 
Ende des ersten Innenschleifenabschnitts 54. Dementsprechend erscheint eine dritte Rekonfigurations-Ubersetzungsan- 
weisung zu Beginn des zweiten Innenschleifenabschnitts 55; eine vierte Rekonfigurations-Ubersetzungsanweisung er- 
scheint zu Beginn des dritten Innenschleifenabschnitts 56 usw. Jeder Rekonfigurationsbefehl verweist vorzugsweise auf 
einen Konfigurationsdatensatz, der von einem Bitstrom dargestellt wird. Der Bitstrom spezifiziert eine interne Hardware- 

25 Organisation fur jede S-Einrichtung 12, und zwar einschlieBlich einer dynarnisch rekonfigurierbaren Prozessoreinheit 
(nachfolgend DRPU genannt), einer AdreB-Betriebseinheit (AOU), einer Befehl-Abrufeinheit (IFU) und einer Datenbe- 
triebseinheit (DOU) (nicht gezeigt). Eine solche Hardware- Organisation ist gedacht und optimiert zur Realisierung einer 
bestimmten Befehlsatzarchitektur (Instruction Set Architecture; ISA). Eine IS-Architektur ist ein einfacher Satz oder 
Kernsatz von Befehlen bzw. Instruktionen, die dazu verwendet werden konnen, um einen Rechner zu programmieren. 

30 Eine IS-Architektur definiert Befehlsformate, Operationscodes, Datenformate, Adressiermodes, Ausfiihrungs-Steuer- 
flags und programmzugangliche Register bzw. Verzeichnisse. Bei der rekonfigurierbaren Rechnerarchitektur, die zur 
Ausfuhrung von Objektdateien eingesetzt wird, die gemaB der vorliegenden Erfindung erzeugt werden, kann jede S-Ein- 
richtung sehr rasch und in Echtzeit konfiguriert werden, um unmittelbar eine Folge von IS-Architekturen durch Verwen- 
dung eines eindeutigen Konfigurationsdatensatzes fiir jede gewiinschte IS-Architektur zu realisieren, die durch einen Bit- 

35 strom spezifiziert wird. Somit wird jede IS-Architektur mit einer speziellen, internen Hardware-Organisation realisiert, 
wie sie durch einen entsprechenden Konfigurationsdatensatz spezifiziert wird. Folglich entsprechen in dem Beispiel aus 
Fig. 2 die ersten funf Innenschleifenabschnitte 54 bis 58 jeweils einer eindeutigen IS-Architektur 1, 2, 3, 4 bzw. k. Der 
Fachmann erkennt, daB jede nachfolgende IS-Architektur nicht eindeutig zu sein braucht. Folglich konnte ISA k 1, 2, 3, 4 
oder irgendeine andere ISA sein. Der Satz von AuBenschleifenabschnitten 52 entspricht ebenfalls einer eindeutigen ISA, 

40 namlich ISA 0. Wahrend der Programmausfuhrung kann die Auswahl nachfolgender Rekonfigurations-Ubersetzungsan- 
weisungen von den Daten abhangen. Bei Auswahl einer gegebenen Rekonfigurations-Ubersetzungsanweisung werden 
im AnschluB daran Befehle bzw. Anweisungen nach einer entsprechenden ISA uber eine eindeutige S-Einrichtungs- 
Hardwarekonfiguration ausgefuhrt, wie sie durch den Bitstrom spezifiziert wird, auf den durch die Rekonfigurations- 
Ubersetzungsanweisung verwiesen wird. 

45 Mit der Ausnahme von Rekonfigurations-Ubersetzungsanweisungen umfaBt das beispielhafte Programmlisting 50 aus 
Fig. 2 ubliche Hochsprachen- Anweisungen, beispielsweise Anweisungen, die entsprechend der C-Programmiersprache 
geschrieben sind. 

Der Fachmann erkennt, daB der Einbau von einer oder mehreren Rekonfigurations-Ubersetzungsanweisungen in einer 
Folge von Programmanweisungen einen Kompiler bzw. ein Ubersetzungsprogramm erfordert, der bzw. das modifiziert 

50 wurde, um den Rekonfigurations-Ubersetzungsanweisungen Rechnung zu tragen. Folglich umfafit das erfindungsge- 
maBe Kompiliersystem und das erfindungsgemaBe Verfahren Vorgange einschlieBUch von Rekonfigurations-Oberset- 
zungsanweisungen durch Zusammenfassung von Verweisungen auf Bitstrbme, die Hardware-Konfigurationen beschrei- 
ben, und durch Ubersetzung bzw. Kompilierung von Quellcode entsprechend den Spezifikationen von bestimmten ISAs, 
die durch die Rekonfigurations-Ubersetzungsanweisungen identifiziert werden. 

55 In einer Ausfiihrungsform der vorliegenden Erfindung unterstutzen alle dem Computer 10 zur Verfugung stehende 
ISAs die folgenden Vorgange: 

- Einen Stapelzeiger (stack pointer; SP) und ein Zeiger AdreBverzeichnis fur nachste Befehle (Next Instruction 
Pointer Address Register; NTPAR; auch bekannt als Programmzahler (PC)), um einen stapel-basierten Speicher von 

60 Informationen und Parametem wahrend der Rekonfiguration zu realisieren; 

- geeignete Befehle in Assemblersprache zur FluBsteuerung, und zwar einschlieBlichbeispielsweise von "jsr" bzw. 
"jump to subroutine" fur einen Unterprogramm-Einsprung und M rts' r bzw. "return to subroutine" fur eine Unterpro- 
gramm-Ruckkehr, und 

- eine geeignete Speicher-Schnittstelleneinheit zum Speichem und Laden von Verzeichniswerten in bzw. aus dem 
65 Stapel. 

Die Betriebsweise dieser Komponenten zur Realisierung einer Rekonfiguration wird nachfolgend anhand der Fig. 6 
bis 8C beschrieben. 
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Komponenten des Kompiliersystems 

In Fig. 4 ist ein Blockschema eines erfindungsgemaBen Kompiliersystems dargestellt. Das Kompiliersystem und das 
erfindungsgemaBe Verfahren lauft auf einer typischen Workstation oder einem PC, der ein ubliches Betriebssystern, wie 
beispielsweise Unix, verwendet. Die Unix-Umgebung ist wegen der groBen Vferfugbarkeit von Quellcode fur Software- 5 
Entwicklungstools und der Robustheit der Benutzer-Umgebung vorteilhaft. Wie der Fachmann erkennen wird, konnte 
das erfindungsgemaBe System und das erfindungsgemaBe Verfahren direkt auf einem rekonfigurierbaren Computer lau- 
fen. In Fig. 3 ist ein FluBdiagramm fur ein erfindungsgemaBes Gesamtverfahren zur Kompilierung bzw. tjbersetzung, 
zur Assemblierung, zur Verbindung bzw. Verkniipfung und zum Laden gezeigt. Die Kompilierschritte aus Fig. 3 werden 
nachfolgend anhand der Fig. 3 A bis 3C ausfuhrlicher beschrieben. 10 

Die QueUdateien 401 werden mit Hilfe eines speziell modifizierten C-Kompilers 402 kompiliert, der nachfolgend be- 
schrieben wird. Der Kompiler 402 liest (301) die QueUdateien 401, die QueUcode-Befehlsanweisungen enthalten, von 
einem Plattenspeicher oder von einem anderen Eingabe- oder Speichergerat. Der Kompiler 402 identifiziert (302) dann 
eine ISA fur einen Untersatz von Quellcodebefehlsanweisungen. In einer Ausfuhrungsform werden IS As von Rekonfi- 
gurations-tJbersetzungsanweisungen identifiziert, wie nachfolgend ausfuhrlicher beschrieben wird. Der Kompiler 402 15 
erzeugt (303) geeignete Rekonfigurations-t)bersetzungsanweisungen, um die identifizierte ISA zu spezifizieren, und 
kompiliert (304) den Untersatz von Befehlen zur Ausfuhrung durch die identifizierte ISA, um Anweisungen in Assemb- 
lersprache zu erzeugen. Der Kompiler 402 bestimmt dann (305), ob ein nachfolgender Untersatz von Befehlsanweisun- 
gen (typischerweise eine separate Funktion innerhalb der Quelldatei 401) mit einer anderen ISA kompiliert werden soil. 
In einer Ausfuhrungsform wird eine solche Bestimmung wiederum dadurch ausgefuhrt, daB die Rekonfigurationsuber- 20 
setzungsanweisungen iiberpriift werden. Falls eine andere ISA identifiziert wird, kehrt der Kompiler 402 zu Schritt 302 
zuriick. 

Anderenfalls, wenn das Ende der Quelldatei erreicht wird, werden die Assemblersprachenanweisungen vom Assemb- 
ler 409 assemblies (306), um Objektdateien 403 zu erzeugen. Die Objektdateien 403 werden mit Hilfe des Softwarelin- 
kers bzw. Softwarebinders 404 verbunden (307), der modifiziert wurde, um Bitstrom-Speicherstellen und abgeglichene 25 
bzw. synchronisierte 64-Bit- Adressen zu behandeln, um ein ausfuhrbares Programm 405 zu erzeugen. Wie nachfolgend 
beschrieben wird, enthalt das ausfuhrbare Programm 405 aufgeloste Verweise (Referenzen) auf ISA-Bitstrome 406, die 
FPGA-Architekturen festlegen. Nachdem das ausfuhrbare Programm 405 vom Binder 404 erzeugt wurde, wird dieses 
iiber die Netzwerkverbindung 408 an das Ladeprogramm 407 gesendet, das auf einem rekonfigurierbaren Computer 10 
ablauft, zum Laden (308) in den Computer 10. Fur den Fall einer dynamischen Verbindung werden ISA-Bitstrome 406 30 
auch iiber die Netzwerkverbindung 408 an das Ladeprogramm 407 gesendet. 



Beliebige und strukturierte Rekonfigurierung 

In einer Ausfuhrungsform laBt der Kompiler 402 eine beliebige Rekonfigurierung (arbitrary reconfiguration) zu, bei 35 
der die Rekonfigurations-Ubersetzungsanweisungen an einer beliebigen Stelle in dem Quellcode lokalisiert sein konnen. 
Bei einer anderen Ausfuhrungsform laBt der Kompiler 402 eine strukturierte Rekonfigurierung (structured reconfigura- 
tion) zu, bei der Rekonfigurierungs-Ubersetzungsanweisungen nur zugelassen wird, wenn von einer Funktion aufgerufen 
oder zuruckgekehrt wird, so daB jede Funktion mit einer einzelnen ISA bezeichnet wird, die wahrend des gesamten Ab- 
laufs der Funktion im Kontext bzw. Zusammenhang sein soli. Wahrend eine beliebige Rekonfigurierung zusatzliche Re- 40 
xibilitat und einen kleineren Quellcode ermoglicht, sorgt eine strukturierte Rekonfigurierung fur eine bessere Vorhersag- 
barkeit und einen besseren Determinismus beim Laden einer ISA, was zu einer groBeren Zuverlassigkeit fuhrt Weil der 
Maschinencode generell fur verschiedene ISAs verschieden ist, wird der Determinismus bevorzugt, so daB der Kompiler 
in der Lage ist, einen geeigneten Maschinencode fur ein bestimmtes Segment des Quellcodes zu erzeugen. Die beliebige 
Rekonfigurierung kann zu nicht deterministischen Situationen fuhren, wenn diese mit gewissen Konditionalkonstrukten 45 
im Quellcode kombiniert wird. Diese Situationen werden durch Verwendung einer strukturierten Rekonfigurierung be- 
seitigt. 

Der folgende Auszug aus einem Code stellt ein Beispiel fur eine nicht deterministische Rekonfiguration dar, die auf- 
treten kann, wenn eine beliebige Rekonfiguration verwendet wird: 

50 

#pragma reconfig ISAO 
x = O 

if(a!=0){ 55 
#pragma reconfig ISA1 
} else { 

#pragma reconfig ISA2 

} 60 

y = x + 2; 



Die ISA im Kontext nach der if-Anweisung kann zum Zeitpunkt der Kompilierung nicht bestimmt werden, weil es zur 65 
Laufzeit zwei mogliche Pfade fiir den SteuerfluB gibt, von denen jeder eine Rekonfiguration zu einer anderen ISA be- 
wirkt. Deshalb kann der Kompiler fiir diese Prozedur keinen giiltigen Maschinencode ausgeben, solange ISA1 und ISA2 
binar kompatibel sind. Ein solcher Nichtdeterminismus wird beseitigt, wenn eine strukturierte Rekonfiguration verwen- 
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det wird, weil nur eine ISA pro Funktion spezifiziert werden kann. 

Bei dem oben genannten Beispiel ist der Wert der Variablen x wahrend des Rekonfigurationsvorgangs geschiitzt, so 
daB auf diesen von der neuen IS-Architektur zugegriffen werden kann. In einer Ausfuhrungsform wird der Wert in einem 
Register bzw. Verzeichnis von IS AO in herkommlicher Art und Weise abgespeichert. Die Rekonfigurierung in ISA1 oder 

5 ISA2 kann jedoch bewirken, daB dieses Verzeichnis aufhort, zu existieren oder seinen Wert verliert, so daB man sich 
nicht auf das Verzeichnis verlassen kann, wenn es den Wert von x nach der Rekonfiguralion liefert. Der Kompiler 402 
uberwacht deshalb die lebenden Verzeichniswerte, die nach einer Rekonfiguration verwendet werden, urn sicherzustel- 
len, daB ihre Werte zur Verfugung stehen, wenn sie benotigt werden. 

Wenn eine beliebige Rekonfiguration verwendet wird, legt der Kompiler 402 fest, wie eine darauffolgende ISA mit ei- 

10 nem Zugriff auf eine Variable versehen wird, indem dieser beriicksichtigU wie die augenblickliche ISA die Variable ab- 
gespeichert hat, ebenso wie die Einrichtungen, auf die die nachfolgende ISA zugreifen muB. In der strukturierten Rekon- 
figuration wird der Stapel dazu verwendet, urn Werte abzuspeichern, wie dies ublich ist, wenn Werte an eine aufgerufene 
Funktion iibergeben oder von dieser abgerufen werden. Weil sich die Verzeichnisarchitektur wahrend der Rekonfigura- 
tion radikal andern kann, werden lebende Variablen von der scheidenden ISA abgespeichert und dann wieder von der 

15 nachfolgenden ISA geladen, wie nachfolgend ausfuhrlicher im Zusammenhang mit Fig, 6 erortert wird. 

Bei einer Ausfuhrungsform realisiert der Kompiler 402 eine bekannte "Linear" -Optimierung (inlining optimization), 
um eine strukturierte Rekonfiguration zu ermoglichen, urn den Aufwand bzw. Systemverwaltungsaufwand der JSR-An- 
weisung zu vermeiden. Inlining ist ein bekanntes Verfahren zur Optimierung der Kompilierung von Funktionsaufrufen, 
indem die Vorgange einer aufgerufenen Funktion "in der Linie" aufgerufen werden, um so den Aufwand zu vermeiden, 

20 der mit dem Aufruf der Funktion in iiblicher Weise verbunden ist. Somit kann ein Code-Segment, wie beispiels weise: 

#pragma reconfig ISA1 
jsr SUBROUTINE^ 
25 #pragma reconfig ISA0 
#pragma reconfig ISA2 
jsr SUBROUTINE JB 
#pragma reconfig ISAO 

30 

ubersetzt werden durch: 

#pragma reconfig ISA1 
35 < code von SUBROUTINE^ > 

#pragma reconfig ISAO 

#pragma reconfig ISA2 

jsr SUBROUTINE^ 
40 #pragma reconfig ISAO 

wodurch die Leistungsfahigkeit verbessen wird, indem die Notwendigkeit einer Sprunganwei sung und einer Programm- 
riickkehr umgangen wird und auch die zugeordneten Stapel-Schreib vorgange, die beim Aufruf einer Funktion und bei 
der Ruckkehr von der Funktion involviert sind. 

45 AuBerdem kann eine zusatzliche Optimierung erfolgen, indem alle Rekonfigurations-Ubersetzungsanweisungen bis 
auf die letzte eliminiert werden, wenn mehr als eine Rekonfigurations-Ubersetzungsanweisung in Folge auftritt. Somit 
kann die dritte Zeile (#pragma reconfig ISAO) von dem oben genannten Code-Segment geloscht werden. 

Wenn man eine beliebige Rekonfiguration verwendet, kann eine aufgerufene Funktion eine Rekonfiguration bewirken, 
die wirksam bleibt, auch nachdem der ProgrammfluB zu der aufgerufenen Funktion zuruckkehrt. Beispielsweise beginnt 

50 eine aufgerufene Funktion, die die oben genannte Code-Auflistung enthalt, in einer ISA, rekonfiguriert zweimal und 
kehrt dann zu einer aufrufenden Funktion zuriick. Von nachfolgenden Anweisungen in der aufrufenden Funktion muB 
deshalb angenommen werden, daB diese die ISA von der letzten Rekonfiguration verwenden. In einer Ausfuhrungsform 
fuhrt der Kompiler 402 eine interprozedurale Analyse durch, um zu bestimmen, welche ISAs sich bei jedem Funktions- 
aufruf und bei jeder Funktionsriickkehr im Kontext befinden. Dort, wo Quelldateien separat in Objektdateien kompiliert 

55 werden, bevor diese in ausfuhrbare Programmanweisungen gebunden werden, kann es schwierig oder unmoglich sein, 
zu bestimmen, welche ISA sich im Kontext befinden wird, nachdem eine aufgerufene Funktion zuruckkehrt. In solchen 
Situationen kann die ISA-Information abgespeichert werden, beispielsweise in Header-Dateien bzw. Kopfinformations- 
dateien, um zu spezifizieren, welche ISA sich im Kontext bei einer Funktions-Einsprungstelle sowie bei einer Funktions- 
Austrittsstelle befindet, und zwar fur alle externen Funktionen, die von einem Modul aufgerufen werden. Alternativ kon- 

60 nen Parameter unter Funktionen weitergeleitet werden, um die ISA-Kontexte zu spezifizieren. 

Wenn eine strukturierte Rekonfiguration verwendet wird, ist die ISA-Information im Vereinbarungsteil der Funktion 
vorgesehen, so daB keine Notwendigkeit besteht, daB der Kompiler 402 ISA-Spezifikalionen gegen den SteuerfluB veri- 
fi ziert, und es gibt keine Moglichkeit, daB eine unerwartete Rekonfiguration wahrend einer aufgerufenen Funktion auf- 
tritt. 

65 Ein weiterer Vorteil einer strukturierten Rekonfiguration besteht darin, daB diese den Rekonfigurationsvorgang vom 
semantischen Standpunkt her besser wiedergibt. Weil eine Rekonfiguration generell ein MaB an Aufwand mit sich bringt, 
das zumindest vergleichbar mit dem Aufwand fur einen Funktionsaufruf ist, und weil eine Rekonfiguration viele dersel- 
ben Arten von Operationen beinhaltet, wie beispielsweise die Abspeicherung von Werten auf einem Stapel, ist es wiin- 
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schenswert, eine ahnliche Syntax sowohl flir die Rekonfiguration als auch fur Funktionsaufrufe zu schaffen. Die struktu- 
rierte Rekonfiguration verbindet die Idee einer Rekonfiguration mit der Idee von Funktionsaufrufen und verwirklicht 
deshalb dieses semantische Ziel. Weitere Beispiele fur eine strukturierte und beliebige Rekonfiguration werden nachfol- 
gend erortert 

5 

Rekonfigurations-Obersetzungsanweisungen 

Bei der bevorzugten Ausfuhrungsform steht vir Rekonfigurations-Obersetzungsanweisungen #pragma, eine normale 
Meta-Syntax, die bei der C-Sprache vorgesehen ist, urn Information an den Kompiler weiterzuleiten, die aus der Sprach- 
syntax herausfallt. Die Verwendung der ^pragma-Syntax ermoglicht es, daB die Rekonfigurations-tJbersetzungsanwei- 10 
sung im Kontext eines C-Programms verwendet werden kann. Ein Beispiel fur eine Rekonfigurations-Obersetzungsan- 
weisung, die man in dem Quellcode finden kann, wtirde wie folgt lauten: 

#pragma func_isa func2 isa2. 

15 

Bei einer Ausfuhrungsform sind drei #pragma-Obersetzungsanweisungen vorgesehen. Jede Ubersetzungsanweisun- 
gen wird auf einem anderen Niveau der Granularitat oder des Gultigkeitsbereichs betrieben und beeinfluBt deshalb einen 
spezifischen Teil des Codes: 

- reconfig: beeinfluBt eine Zwischen-Rekonfiguradon zu einer neuen ISA (Gultigkeitsbereich ist ein beliebiger 20 
Block des Codes); 

- fiinc_isa: spezifiziert fur eine besdmmte Funktion eine ISA (Guldgkeitsbereich ist die Funktion); und 

- default_func_isa: spezifiziert eine Standard-ISA (Gultigkeitsbereich ist die gesamte Datei). 

Diese Rekonflguradons-Ubersetzungsanweisungen resulderen in Registertransferniveau-Rekonfiguradonsanweisun- 25 
gen (RTL), die den Kompiler mit Information versorgen, um zu bestimmen, welche ISA fur jeden Block des Codes be- 
notigt wird, wie nachfolgend ausfuhrlicher beschrieben wird. 

Das nachfolgende Codelisting stellt ein Beispiel fur die Verwendung von jeder der oben genannten tjbersetzungsan- 
weisungen in einer strukturierten Rekonfiguradonsumgebung dar. 

30 



35 



40 



45 



50 



55 



60 



65 
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1 #iaclude " icarus_cypes .h" 

2 #include • icarus_isas . a" 

3 #include -fixed -a" . 

4 ^pragma default_func_isa ISAC 

5 uns8 col or_map [2561 ? 

6 #pragma func.isa build_color_raap PIXED_POINT_I5A 

7 void 

3 build_color_map(intl6 contrast) 

9 i , , 

in unsigned color; 

11 uns8 *color_map_Cmp » color _jnap; 

12 for (color = 0; color < 255U; cblor++) '{ 

13 color_map_tmp [color] - 

" £ixed_mul_iat9 (contrast, color); 

14 > 

15 } 

16 void 

17 map_contrast(int x, inc y, unsS -image) 

IS C . 

19 register xnt 1, cmp; 

20 cmp = x ' y; 

21 tpragrca reconfig BYTE_MAP_ISA 

22 { 

23 register int i; 

24 register uns8 *rnap; 

25 register uns8 *image_tinp ; 

26 ^pragma isa_pragma map_pointer map 

27 #pragma isa_pragma image_poa.nter image.tmp 

28 #pragma isa_pragma loop_counter x 

29 image_tmp = image; 

30 map ~ color. map; 

31 for (i = tmp; i>0; i— ) ,C 

32 * image_tmp - map [ * ijnage_tinp J ; 

33 image_tmp++; 

34 ) 

35 > 
3S } 

37 <Jo_contrast(int x. int y, uns8 *iraage, 

uns8 contrast) 

38 < 

39 build_color_jnap (contrast) ; 

40 rnap_contrast (x, y, image); 

41 } 



Zeile 4 des Codelistings stellt ein Beispiel fiir die default_func_isa-Ubersetzungsanweisung dar, die spezifiziert, daB 
ISA0 fiir jegliche Funktionen verwendet werden soil, die keine andere ISA spezifizieren. Der Giiltigkeitsbereich dieser 
Ubersetzungsanweisung ist die gesamte Datei; deshalb gilt die Ubersetzungsanweisung fiir das gesamte gezeigte Listing. 

Zeile 6 des Codelistings stellt ein Beispiel fiir die func_isa-t)bersetzungsanweisung, die spezifiziert, daB FI- 
XED_POINTJSA die geeignete ISA fur die Funktion darstellt, die build_color_map genannt wird. Der Giiltigkeitsbe- 
reich dieser Ubersetzungsanweisung ist die spezifizierte Funktion. 

Zeile 21 des Codelistings stellt ein Beispiel fiir die reconfig-Ubersetzungsanweisung dar; die spezifiziert, daB 
BYTE_MAP_IS A die geeignete ISA fiir den Codeblock darstellt, der unmittelbar der Ubersetzungsanweisung folgt. Der 
Gultigkeitsbereich dieser Ubersetzungsanweisung ist der in den Zeilen 22 bis 35 des Codelistings gezeigte Codeblock. 

Das folgende Codelisting stellt ein Beispiel fur die Verwendung von jeder der oben genannten Ubersetzungsanweisun- 
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gen in einer beliebigen Rekonfigurationsumgebung dar. 

1 unsigned char color_map[256] r 

2 /* int is 16 bits for supercomputer 1A V 

3 typedef unsigned int unslfi; 

4 typedef unsigned char uns8; 



5 void 

6 build color^mapfunslb contrast) 

7 { 

8 int color; 

9 #pragina reconf ig Fixedlsa 

10 for (color - 0; color < 256; color+i-) C 

11 color_map [color] = 

fi2ced_jaul_int8 (contrast, color) ; 

12 } 

13 } 

14 map_contrast{int x, int y, uns8 'image) 

15 { 

16 register int i, trnp; 

17 register uns3 *roap; 

13 ttnp = x * y; 

19 #pragma reconfig ByteMapIsa 

20 #pragzna map jointer map 

21 #pragma map^councer i 

22 #pragma target_pointer image 

23 i = tirp; 

24 map = color — map; 

25 while <i~) { 

26 *image » map [* image ] ; 

27 image* +; 

28 } 

29 } 

30 /* Beim Einsprung in dq^contrast IsaO annehmen */ 

31 do_concrast (int x, int y, uns8 * image, 

BinFrac ^contrast) 

32 { 

33 build_colar_map (contrast) ; 

34 maD_contrast <x, y, image); 

35 } 



Zeilen 9 und 19 enthalten reconfig-Obersetzungsanweisungen, die solange wirksam bleiben, bis eine andere Rekonfi- 
gurations-tTbersetzungsanweisung festgestellt wird. Fiir eine beliebige Rekonfiguration konnen die Ubersetzungsanwei- 
sungen an einem beliebigen Punkt in dem Code auftreten und sie sind nicht auf die Funktionsebenen-Granularitat be- 
grenzt. 



Kompilierungsverfahren 

In den Fig. 3A und 3B ist ein FluBdiagramm eines bevorzugten Kompilierungsverfahrens gernaB der vorliegenden Er- 
findung gezeigt. Fig. 3A zeigt die Schritte, die von der Kornpiler-Oberflache ausgefuhrt werden, wahrend Fig. 3B die 
Schritte zeigt, die vom Kompiler-Kern ausgefuhrt werden. Die Oberflache interpretiert Rekonfigurations-Ubersetzungs- 
anweisungen und erzeugt RTL-Anweisungen, die vora Kern in ublicher Weise interpretiert werden konnen. Wie man 
weiB, sind RTL-Anweisungen ISA-unabhangige Zwischenniveauanweisungen, die den herkommlichen Kompilern ein- 
gesetzt werden, die beispielsweise in dem GNU C-Kompiler (GCC), der von der Firma Free Software Foundation (Cam- 
bridge, MA) hergestellt wird. RTL kann entsprechend der Spezifikation des Stanford University Intermediate Format 
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(SUIF) ausgefuhrt werden, wie diese in Stanford SUIF Compiler Group, SUEF: A Parallelizing & Optimizing Research 
Compiler, Tech; Rep. CSL-TR-94-620, Computer Systems Lab, Stanford University, May 1994 offenbart ist. Beispiels- 
weise konnte die Quellcode-Anweisung: 

5 x = y + 3; 

in RTL wie folgt dargestellt werden: 

rl <- y 
io r0<-rl+3 
x<-r0. 

Das Verfahren aus den Fig* 3A und 3B zieht als EingangsgroBe die Quelldatei 401 heran, die eine Folge von Hoch- 
sprachen-Quellcodebefehlsanweisungen enthalt und die auch rnindestens eine Rekonfigurauons-Ubersetzungsanwei- 
sung enthalt, die eine ISA zur Ausfuhrung von nachfolgenden Anweisungen spezifiziert. Um dies zu erlautern, sei eine 

15 strukturierte Rekonfigurationsumgebung angenommen, bei der eine Rekonfiguration Funktion fur Funktion erfolgt. Die 
Oberflache des Kompilers 402 wahlt (600) die nachste Hochsprachenanweisung von der Quelldatei 401 aus und stellt 
fest (601), ob die ausgewahlte Hochsprachenanweisung ein Funktionsaufruf ist. Falls dies nicht der Fall ist, sendet (603) 
der Kompiler 402 einen RTL-Code fur diese Anweisung. 

Falls der Kompiler 402 in Schritt 601 feststellt, daB die Anweisung ein Funktionsaufruf ist, stellt der Kompiler 402 in 

20 Schritt 602 fest, ob die gerade aufgerufene Funktion in einer anderen ISA als der gerade im Kontext befindlichen ISA ab- 
lauft. Falls dies nicht der Fall ist, gibt der Kompiler 402 im Schritt 605 einen RTL-Code fur den Funktionsaufruf und fur 
das Einlesen des Ruckkehrwerts der Funktion in Schritt 613 ab. 

Falls der Kompiler 402 in Schritt 602 feststellt, daB die Funktion in einer anderen ISA arbeitet, gibt der Kompiler 402 
einen RTL-Code ab, der erforderlich ist, um die Rekonfiguration zu bewirken, und zwar einschlieBlich des Abspeicherns 

25 aller lebenden Register in Schritt 607 und der Durchfuhrung der Rekonfiguration in Schritt 604. Bei der bevorzugten 
Ausfuhrung sform handelt es sich bei der RTL-Rekonfigurationsanweisung um keine Standard-RTL-Anweisung, die eine 
ISA-Identifikation enthalt. Der Kompiler 402 gibt dann in Schritt 606 einen RTL-Code fur den Funktionsaufruf ab. Der 
Kompiler 402 gibt dann in Schritt 609 den RTL-Code fur die Rekonfiguration zuriick an die erste ISA, um in Schritt 611 
lebende Register wieder abzuspeichem und um den Riickgabewert der Funktion in Schritt 613 zu lesen. 

30 Bei Beendigung der Schritte 603 oder 613 stellt der Kompiler 402 in Schritt 608 fest, ob eine andere Hochsprachen- 
anweisung berucksichtigt werden muB. Falls dies der Fall ist, kehrt der Kompiler 402 zu Schritt 600 zuriick; anderenfalls 
fahrt er mit Schritt 610 fort. 

In Fig. 3B fu hit der Kern des Kompilers 402 die Schritte 610 bis 622 aus, um zuvor generierte RTL- Anweisungen in 
Assemblersprache zu ubersetzen. 

35 Der Kompiler 402 wahlt dann in Schritt 612 eine nachste RTL-Anweisung innerhalb der augenblicklich beriicksich- 
tigten Gruppe von RTL-Anweisungen aus. Der Kompiler 402 erhalt in Schritt 618 eine Regel, die eine Weise spezifiziert, 
in der die augenblickliche Gruppe von RTL-Anweisungen in einen Satz von Maschinenspracheanweisungen ubersetzt 
werden kann, die fiir die augenblicklich berucksichtigte Gruppe von RTL-Anweisungen existiert. Der Kompiler 402 er- 
zeugt in Schritt 620 einen Satz von Maschinenspracheanweisungen, die entsprechend der Regel der augenblicklich be- 

40 riicksichtigten Gruppe von RTL-Anweisungen entspricht. Der Kompiler 402 stellt dann in Schritt 622 fest, ob eine an- 
dere RTL-Anweisung innerhalb des Kontext einer nachsten Gruppe von RTL-Anweisungen berucksichtigt werden muB. 
Falls dies der Fall ist, kehrt der Kompiler 402 zu Schritt 612 zuriick. Anderenfalls fuhrt der Kompiler 402 in Schritt 610 
Registerreservierungsschritte (register allocation) aus. Bekanntlich ist eine konsistente Registerarchitektur von einer ISA 
zur anderen nicht unbedingt erforderlich. AuBerdem konnen gewisse Innenschleifen-ISAs spezielle Register besitzen, 

45 fiir die normale Registerreservierungsvorgange nicht gelten. Im allgemeinen sind jedoch AuBenschleifen-ISAs in der 
Lage, normale Registerreservierungen zu verwenden. 

Beispiels weise konnte der oben angefuhrte RTL-Code etwa wie folgt in einen Assembler-Code ubersetzt werden, wo- 
bei der Assembler-Code von ISA zu ISA verschieden ware: 

50 Id y, r3 
Id [r3], rO 
add 3, rO 
StrO, [x]. 

55 Somit erzeugt der Kompiler 402 wahlweise und automatisch in Entsprechung mit Vielfach-ISAs wahrend Kompilie- 
rungsvorgangen Assemblersprachenanweisungen. Oder mit anderen Worten: Wahrend des Kompilierungsvorgangs 
kompiliert der Kompiler 402 einen Einzelsatz von Programmanweisungen von den Quelldateien 401 entsprechend einer 
variablen ISA. Bei dem Kompiler 402 handelt es sich vorzugsweise um einen ublichen Kompiler, der modifiziert ist, um 
die bevorzugten Kompilierungsvorgange durchzufuhren, die zuvor anhand der Fig. 3 A und 3B beschrieben wurden. 

60 Der Assembler 409 bzw. der Ubersetzer fur maschinenorientierte Prograrnmiersprache wird betrieben, um Maschinen- 
sprachenanweisungen, die vom Kompiler 403 erzeugt wurden, auch dazu zu verwenden, um Objektdateien 403 zu erzeu- 
gen. Die Objektdateien 403 werden dann vom Binder bzw. Linker 404 gebunden, der Bitstrom-Speicherstellen und 64- 
Bit, Bitausgerichtete bzw. Bit-abgeglichene Adressen handhabt, um ein ausfuhrbares Programm 405 zu erzeugen. Das 
Ladeprogramm 407 verkettet gleiche Segmente von einer Anzahl von Objektdateien 403, einschlieBlich von Bitstrom- 

65 Segmenten, in ein einzelnes Speicherbild zur Ubermittlung an einen rekonfigurierbaren Computer 10. Bei einer Ausfuh- 
rungsform erfolgt eine solche Verkettung wahrend der Laufzeit bzw. in Echtzeit; bei einer altemativen Ausfuhrungsform 
erfolgt dies off-line. Es ist vorteilhaft, wenn der Binder 404 in der Lage ist, eine Speicherausrichtung bzw. einen Spei- 
cherabgleich auf dem ausfuhrbaren Programm 405 auszufuhren, um fiir die Ausrichtungserfordernisse fiir den FPGA- 
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Biistrom zu sorgen. Gewisse FPGA-Ladeprogrammhardware erfordert Bitstrome von konstanter GroBe. Deshalb kann 
der Binder die Speicherausrichtung vornehmen, indera er Bitstrome auffullt, damit die Anforderungen fur eine solche 
Hardware erfiillt werden. 

Wenn ein statisches Einbinden (static linking) verwendet wird, werden Bitstrome 406 und ausfiihrbare Programme 
405 vom Binder 404 zur Zeit des Bindens verbunden. Wenn ein dynamisches Binden verwendet wird, werden die ISA- 
Bitstrome 406 und die ausfuhrbaren Programme 405 zum Zeitpunkt des Ladens des Programms verbunden, so daB das 
ausfiihrbare Programm 405 und die Bitstrome 406 iiber die Netzwerkverbindung 408 zu dem Ladeprogramm 407 gesen- 
det werden, das auf einen rekonfigurierbaren Computer 10 lauft. 

In Fig, 3C ist ein FluBdiagrarnm von weiteren Schritten gezeigt, die zur Erzeugung eines Maschinensprachencodes ge- 
maB einer Ausfuhrungsform der vorliegenden Erfindung ausgefuhrt werden. Dieses FluBdiagrarnm gibt im Detail die 
Zwischendateien an, die erzeugt werden, wenn der RTL-Code in einen maschinenlesbaren Code fur einen rekonfigurier- 
baren Computer ubersetzt wird. Der RTL-Code ist mit Bemerkungen versehen 331, um anzuzeigen, welche ISA sich in 
Kontext flir jede RTI^ Anweisung in dem Code befindet. Zu diesem Zeitpunkt werden RTL-Anweisungen modifiziert. 
Der Kode wird dann in Schritt332 mit Hilfe von ISA-abhangigen Verfahren und ISA-unabhangigen Verfahren mittels ei- 
nes Optimierungs-Dienstprograrnmes optimiert. Obwohl das Optimierungsdienstprogramm eine ISA-abhangige Opti- 
mierung ausfuhrt, verwendet seine Ausgabe maschinenunabhangigen Code. Somit wiirde die Ausgabe dennoch auf einer 
beliebigen ISA laufen, obwohl dies nicht notwendiger Weise optimal ist. SchlieBlich werden maschinenabhangige Be- 
fehle im Schritt 333 von dem optimierten Code mittels des Assemblers 409 erzeugt. Dieser Code verwendet abstrakte 
Register (abstract registers) und andere maschinenabhangige Merkmale. Zusatzliche Schritte zum Aufraumen von Ver- 
kniipfungen bzw. Links und weitere unwichtige Schritte konnen dann ausgefuhrt werden. 

Bei der bevorzugten Ausfuhrungsform der vorliegenden Erfindung umfassen die ISAs eine reconfig-Anweisung, die 
bewirkt, daB der FPGA von S-Einrichtung 12 einen Bitstrom ladt, auf den mittels eines Parameters der Anweisung ver- 
wiesen wird. Somit besitzt jede ISA zumindest einen Programmverschiebungstyp, der mit Programmverschiebungsbit- 
stromadressen in Zusammenhang stent, die als Parameter fur die reconfig- Anweisung der ISAs verwendet werden. Die 
ProgrammverschiebungseinsprungsteDe in der Objektdatei teilt dem Binder mit, die augenblickliche Adresse einer 
GroBe in ein Segment eines ausfuhrbaren Programms zum Zeitpunkt der Bindung zu ersetzen. Programmverschiebungs- 
typen werden nachfolgend ausfuhrlicher beschrieben. 

Wie nachfolgend beschrieben wird, werden Bitstrome als Datenobjekte definiert, die sich in einem bestimmten Ab- 
schnitt befinden, mogiicherweise nur zum Lesen, und deshalb sind Standard-Programmverschiebungsverfahren in der 
Lage, fur eine Programmverschiebung von Bitstromadressen zu sorgen, die in analoger Weise mit IS A-reconfig-Anwei- 
sungen zu irgendwelchen programmdefinierten, nur lesbaren Daten verwendet werden. 

^ Der rekonfigurierbare Computer 10 fuhrt die Ergebnisse von dem Ladeprogramm aus, das nachfolgend anhand der 
Fig* 9 bis 25B beschrieben wird. Insbesondere erkennt der rekonfigurierbare Computer 10 reconfig-Anweisungen und 
ladt geeignete IS A-Bitstrome, wie sie in Parametern fur solche Anweisungen spezifiziert sirid. 

Erhaltung des Programmzustands 

Eine FPGA-Rekonfiguration durch Laden einer neuen ISA kann zu einem Verlust von intemer Hardwarezustandsin- 
formation fuhren. Folglich behalt das erfindungsgemaBe System und das Verfahren den Programmzustand wahrend einer 
Rekonfiguration bei, um den Verlust der Ausfuhrungsbefehlsfolge bei solchen Ubergangen der Hardware zu vermeiden. 

Wahrend der Rekonfiguration verwendet der rekonfigurierbare Computer 10 vorzugsweise einen Aufrufstapel, um ir- 
gendwelche Daten abzuspeichern, die erforderlich sein konnten, nachdem die neue ISA geladen worden ist. Ein'solcher 
Speichervorgang wird durch Schieben von Werten auf den Aufrufstapel bewerkstelligt und durch Abspeichern des Sta- 
pelzeigers in einer vordefinierten Speicherzelle, die nicht durch die Rekonfiguration beeinfluBt werden wird. Im An- 
schluB an die Rekonfiguration verwendet der rekonfigurierbare Computer 10 den Stapelzeiger, um die zuvor abgespei- 
cherten Werte von dem Aufrufstapel auszuspeichern. 

Es sind Stapel in Laufzeitumgebungen fur laufende Maschinenprogramme bekannt, die von Hochsprachen kompiliert 
wurden, die eine Rekursion unterstutzen, wie beispielsweise C/C++, Lisp und Pascal. Ein Stapel ist in einem Bereich des 
Speichers realisiert und der Stapelzeiger (stack pointer; SP) wird in der ISA dazu verwendet, um die Adresse des Beginns 
des Stapels zu behalten. Ein Wert, beispielsweise die Programrndaten oder die Adresse, wird in dem Stapel gespeichert 
(oder auf den Stapel "geschoben"), indem der Stapelzeiger dekrementiert wird und der Wert in die in dem Stapelzeiger 
enthaltene Adresse geschrieben wird. Der Wert wird wieder von dem Stapel abgerufen (oder vom Stapel "herunterge- 
schoben"), indem der Wert von der in dem Stapelzeigerregister enthaltenen Adresse gelesen wird; dann wird der Stapel- 
zeiger inkrementiert. 

Bei der vorliegenden Erfindung wird der dynamische Zustand des Programms, wie beispielsweise lokale Viriablen 
und die Speicherstelle der nachsten Anweisung, die die Hardware ausfuhren soil, die typischerweise in einem AdreBre- 
gister fur den nachsten Anweisungszeiger (Next Instruction Pointer Address Register; NIPAR) oder in einen Programm- 
zahler (PC) abgespeichert ist, vor der Rekonfiguration der Hardware auf dem Stapel abgespeichert. Der Stapelzeiger 
wird bei der vorbestimmten Speicheradresse aufbewahrt. Somit werden die Werte des Stapelzeigers und des NIPARs bei 
der Hardware-Rekonfiguration aufbewahrt, so daB auf diese spater Zugriff genommen werden kann, wenn die Ausfuh- 
rung des Programms beginnt. 

In Fig. 6 ist ein FluBdiagrarnm fur ein Verfahren zum Konservieren des Programmzustands gemaB der vorliegenden 
Erfindung gezeigt. Bei Schritt 601 wird eine reconfig-Anweisung empfangen, die anzeigt, daB ein Bitstrom, der eine 
neue ISA-Konfiguration darstellt, in die Prozessor-Hardware geladen werden soli. Das Argument fur die reconfig-An- 
weisung ist eine physikalische Speicheradresse, die die zu ladende ISA-Konfigurauon enthalt. 

Der Stapelzeiger wird bei Schritt 652 dekrementiert und der NIPAR wird in Schritt 653 in die von dem Stapelzeiger 
angezeigte Adresse hineingeladen, wodurch NIPAR auf den Stapel geschoben wird. Der Stapelzeiger wird in Schritt 654 
unter einer vorbestimmten Adresse im Speicher abgespeichert, die der neuen ISA-Konfiguration bekannt ist. Die neue 



13 



DE 198 15 865 A 1 



ISA-Konfiguration wird dann im Schritt 655 in die Hardware hineingeladen, indem die FPGA 12 dazu veranlaBt wird, 
den ISA-Bitstrom von einer Speicherstelle in dem Bitstromspeicher 132 zu lesen. Sobald die neue Konfiguration geladen 
worden ist, ladt diese in Schritt 656 den Stapelzeiger von der bekannten, vorbestimmten Adresse und ladt dann NIPAR 
von dem Stapel, indem dieser von der Speicherstelle abgerufen wird, die in Schritt 657 in dem Stapelzeiger abgespeichert 
5 wurde und dann wird der Stapelzeiger in Schritt 658 inkrementiert. Ein Beispiel fur Stapeiinhalte wahrend des Rekonfi- 
gurationsvorgangs aus Fig. 6 wird nachfolgend anhand der Fig. 8A bis 8C beschrieben. 

Realisierung einer strukturierten Rekonfiguration 

10 Bei einer Ausfuhrungsform der vorliegenden Erfindung wird eine strukturierte Rekonfiguration dadurch bewerkstel- 
ligt, daB reconfig-Anweisungen von dem Quellcode in eine Folge von Assemblersprachenanweisungen ubersetzt wer- 
den. Wie zuvor beschrieben wurde, werden bei der strukturierten Rekonfiguration Rekonfigurations-ttbersetzungsanwei- 
sungen nur dann zugelassen, wenn eine Funktion aufgerufen wird oder zu einer Funktion zuriickgekehrt wird, so daB jede 
Funktion mit einer einzigen ISA gekennzeichnet ist, die sich wahrend der gesamten Ausfiihrung der Funktion im Kontext 

15 befinden soil. In Fig. 7 ist ein FluBdiagramm fur ein Verfahren zur Realisierung der strukturierten Rekonfiguration ge- 
maB einer Ausfuhrungsform der vorliegenden Erfindung gezeigt. 

Das Verfahren gemaB Fig. 7 wird ausgefuhrt, wenn der Aufruf einer Funktion eine aufgerufene Funktion mit sich 
bringt, die eine ISA-Rekonfigurationsanweisung besitzt. Die S-Einrichtung 12 rettet in Schritt 707 lebende Register- 
werte, so daB diese nicht als Folge der Rekonfiguration verlorengehen. Die S-Einrichtung 12 verwendet die augenblick- 

20 liche ISA, um in Schritt 701 Parameter fur die aufgerufene Funktion auf den Stapel zu schieben, weil diese Parameter in 
Registem vorliegen konnen. Die S-Einrichtung 12 rekonfiguriert in Schritt 702 in die neue ISA und ruft in Schritt 703 das 
Unterprogramm auf, das die Funktion darstellt, wobei eine Anweisung, wie bei spiels weise "jsr", der ISA der Zielfunk- 
tion verwendet wird. Nachdem die aufgerufene Funktion die Ausfiihrung beendet hat, kehrt eine Riickkehranweisung, 
wie beispielsweise "ret", in Schritt 704 zu der aufrufenden Funktion zuruck. S-Einrichtung 12 10 rekonfiguriert in Schritt 

25 705 zu der urspriinglichen ISA fur die aufrufende Funktion, liest in Schritt 706 einen Ruckgabewert der aufgerufenen 
Funktion und speichert lebende Registerwerte in Schritt 708 wieder ab. Die Verfahren aus Fig. 7 zur Weitergabe von Sta- 
pelparametern und zur Riickgabe von Werten konnen in ublicher Weise realisiert werden, wie sie in nicht rekonfigurier- 
baren Computem verwendet werden, die keine Parameter oder Riackgabewerte in Register weiterleiten. 
Das folgende stellt ein Beispiel fur einen Code zur Realisierung einer strukturierten Rekonfiguration dar: 

30 

#pragma fiincjsa fund anotherjsa 
int 

funcl(int *i) 

* { 

40 #pragma funcjsa main isaO 
mainO 

{ 

int foo, bar; 

45 

bar = fiincl (&foo); 

50 

Zwei Funktionen sind bekannt: main, das ISAO verwendet, einen Mehrzweck-Anweisungssatz; und fund, das einen 
anderen Anweisungssatz (another IS) verwendet, der als another_isa bezeichnet wird. Die #pragma-Anweisungen spezi- 
fizieren die Anweisungssatze fur die zwei Funktionen. 

In einer Ausfuhrungsform der vorliegenden Erfindung, die eine strukturierte Rekonfiguration verwendet, wurde der 
55 Kompiler 402 die Funktion call bar = fund (&foo) von dem oben genannten Listing in den folgenden Assemblercode 
iibersetzen. Dabei wurden Kommentare zum Zwecke der Erlauterung hinzugefiigt. 

I ; schaffe Platz fur den Ruckgabewert durch Dekremenderung von SP 
2eldil6,a0 

3 esub aO, sp 
60 4 ; berechne die Adresse von Argument foo 

5 emov sp, al 

6 eadd a0. al 

7 ; und schiebe diese auf den Stapel 

8 estr al, sp 
65 9 ; reconfig 

10 reconfig anotherjsa 

II ; rufe das Unterprogramm auf 
12 jsr fund 
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13 ; gehe zuriick zu isaO 

14 reconfig isaO 

15 ; losche den geschobenen Parameter 
16eldfd0 

17 ; und lese das Ergebnis in die Register-variable bar 5 
181dfd0 

AuBerdern konnte Assemblercode zum Abspeichem und wieder Herstellen von lebenden Registerwerten vor der Zeile 1 
bzw. nach der Zeile 18 hinzugefiigt werden. 

In den Fig. 8A bis 8C sind Diagramme der Speicherinhalte bei verschiedenen Punkten wahrend der Ausfuhrung des 
Assemblercodes gezeigt. Die Fig. 8A zeigt den Zustand des Stapels 800 nach der Ausfiihmng der Zeilen 1 bis 8 des oben 10 
angefuhrten Assemblercodes. Diese Zeilen bilden den Stapelrahmen, der von fund verwendet wird. Zunachst wird Platz 
geschaffen, um einen Ruckgabewert abzuspeichem; dann wird die Adresse der Variablen foo auf den Stapel geschoben. 
Die Speicherstelle 801 enthalt die Variable foo im Stapelrahmen fiir die Funktion main. In diesem Beispiel wird die Va- 
riable bar in einem IS AO-Register abgespeichert und erscheint deshalb nicht auf dem Stapel 800. Die Speicherstelle 802 
wird fur einen Ruckgabewert reserviert und die Speicherstelle 803 enthalt die Adresse der Variablen foo. 15 

Fig. 8B zeigt den Zustand des Stapels 800 auf halben Wege wahrend der Ausfuhrung der reconfig- An weisung bei 
Zeile 10. Wie man auch durch Vergleich mit Fig. 6 erkennen wird, entspricht dieser Zustand des Stapels 800 dem Ende 
des Schrittes 654, unmittelbar bevor die neue Konfiguration geladen werden soli. Die augenblickliche Adresse der nach- 
sten Anweisung (NIPAR) wurde auf den Stapel 800 bei der Speicherstelle 804 geschoben und der Stapelzeiger SP wurde 
auf eine vorbestimmte Adresse (nicht gezeigt) geschrieben. An dieser Stelle werden die Schritte 655 bis 658 ausgefuhrt, 20 
namlich die Hardware wird rekonfiguriert, der Stapelzeiger wird geladen und NIPAR wird ausgespeichert, wie zuvor be- 
schrieben wurde. 

Fig. 8C zeigt den Zustand des Stapels 800 bei der Einsprungstelle zu fund, wobei die jsr fund -Anweisung bei Zeile 
12 verwendet wird. Die Speicherstelle 804 enthalt nun die Ruckkehradresse. Wenn fund zuruckkehrt, rekonfiguriert der 
Computer 10 zu ISAO zuriick, wird der Parameter &foo von dem Speicher entfernt und wird der Riickkehrwert in die Va- 25 
liable bar gelesen, die der Kompiler 402 fur Register dO reserviert hatte. 

Ausfuhrbares Programm und Bindungsformat 

Die bevorzugte Ausfuhrungsform der vorliegenden Erfindung erweitert Standardparadigmen zur Softwareentwick- 30 
lung, um Bitstrome mit einzuschiieBen, die Hardwarekonfigurationen festlegen, die einen mit Hilfe von FPGAs realisier- 
ten Computer spezifizieren, der binare Maschinenanweisungen von einer ausfuhrbaren Datei 405 ausfuhrt. Dies wird da- 
durch bewerkstelligt, da6 ein neues Dateiformat verwendet wird, das als ICARUS ELF bezeichnet wird und das eine Er- 
weiterung des Executable and Linking Format (ELF) umfaBt, das haufig auf Unix- Workstations verwendet wird und in 
UNIX System Laboratories, Inc., System V Application Binary Interface, 3. Auflage, 1993 beschrieben ist und das hier- 35 
mit im Wege der Bezugnahrne in dieser Patentbeschreibung mit aufgenommen sei. 

Wie in dem UNIX System Laboratories, Inc., System V Application Binary Interface, 3. Auflage, 1993 beschrieben 
ist, handelt es sich bei ELF-Dateien entweder um progranimverschiebliche (relocatable) Dateien (Objektdateien 403) 
oder um ausfuhrbare Dateien 405. ELF sorgt fur Parallelansichten der Inhalte der Datei, was die differierenden Erforder- 
nisse dieser zwei Formate reflektiert. In Fig. 5 ist im Teil 501 ein typisches ELF-Dateiformat in einer Binden-Ansicht 40 
und im Teil 502 in einer Ausfuhren-Ansicht gemafi dem Stand der Technik dargestellt. Der ELF-Kopfteil 503 enthalt ei- 
nen "Plan", der die Organisation der Datei beschreibt. Die Abschnitte 505 beinhalten den GroBteil der Information der 
Objektdatei fur die Binden-Betrachtungsweise 501, einschlieBlich von Anweisungen, Daten, Symboltabellen, Verschie- 
bungsinformation und dergleichen, wie nachfolgend ausfuhrlicher beschrieben wird. Die Abschnitte 507, die in der Aus- 
fuhren-Darstellung 502 verwendet werden, entsprechen den Abschnitten 505, wobei jeder Abschnitt 507 einem oder 45 
mehreren Abschnitten 505 entspricht. AuBerdern konnen die Abschnitte 507 Kopfteile umfassen, die Information enthal- 
ten, wie beispielsweise die Information, ob der Abschnitt 507 sich in einem Schreib-Speicher befindet, was auf die Ab- 
schnitte 505 anwendbar sein kann oder nicht. Im allgemeinen enthalten die Abschnitte 505 Information, die wahrend des 
Bindens verwendet wird, wahrend die Abschnitte 507 Information enthalten, die wahrend des Ladens verwendet wird. 

Die Programmkopfteiltabelle 504 (falls vorhanden), teilt dem Computer 10 mit, wie ein Verarbeitungsbild aufzubauen 50 
ist. Die Abschnittskopfteiltabelle 506 enthalt Information, die die Abschnitte 505 beschreibt. Jeder Abschnitt 505 besitzt 
einen Eintrag in Tabelle 506; jeder Eintrag gibt Information an, wie beispielsweise den Namen des Abschnitts, die GroBe 
und dergleichen. Die in Fig. 5 gezeigten Elemente konnen in einer beliebigen Reihenfolge vorgesehen sein und einige 
Elemente konnen fehlen. 

Weitere Details, die die in Fig, 5 gezeigten Elemente betreffen, kann man in UNIX System Laboratories, Inc., System 55 
V Application Binary Interface, 3. Auflage, 1993 finden. Die folgende Beschreibung erklart die Unterschiede zwischen 
dem Standard-ELF, wie in System V Application Binary Interface beschrieben, und dem ICARUS ELF-Dateiformat, das 
bei der vorliegenden Erfindung verwendet wird. 

Das ICARUS ELF-Dateiformat verwendet prozessorabhangige Merkmale von ELF, um fiir eine Verschiebung von 
Bitstromadressen zu sorgen, die innerhalb des Programmtextes verwendet werden, und um fur eine Verschiebung und fur 60 
ein Binden von Bitstromen in Segmente zu sorgen, die wahrend des Ablaufens des Programms innerhalb eines hierfur 
vorgesehenen Bitstromspeichers 132 geladen werden konnen. ICARUS ELF erweitert somit Standard-ELF, um die Ab- 
speicherung von Bitstromen zu erleichtern, die FPGA-Konfigurationen so wie den ausfuhrbaren Code definieren, der auf 
der FPGA-definierten Hardware lauft 

ICARUS ELF erganzt den Standard-ELF, um fur neue Datentypen, Abschnitte, Syraboltypen und Verschiebungstypen 65 
fiir ISA-Bitstrome zu sorgen. 
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Datentypen 

Bei der bevorzugten Ausfiihrungsfonn verwendet der rekonfigurierbare Computer Bitadressen, die 64 Bit breit sind. 
Die Adressen zeigen auf den Bitversatz des niedrigstwertigen Bits des Daten-Gegenstands. ICARUS ELF ist fur 64-Bit 
5 Byte-Adressen ausgelegt, wobei die Adresse auf das erste Byte (niedrigstwertig fur kleine Endian-Prozessoren, hochst- 
wertig fiir groBe Endian-Prozessoren) fur jedes Datenelement zeigt. Wahrend die Versatze in Kopfteilen beziiglich der 
Bytes definiert werden, werden zu verschiebende Adressen in 64-Bit Bit- Adressen spezifiziert. Dies laBt die \ferwendung 
eines Binders auf einem Byte-orientierten Computer zu. ICARUS ELF verwendet zwei neue Datentypen, um eine 64- 
Bitadressierung zu erleichtem: 

to 

- ICARUS_ELF_Addr Gr6Be-8-Bytes, mit Ausrichtung, die fur die augenblickliche ISA durch festgelegt 
wind, das den Zweier-Logarithmus der Bitbreite des Speichers darstellt (beispielsweise 3 fur 8-Bit, 4 fur 16-Bit). 

- ICARUS_ELF_Off: Byte-Versatz in die Datei, GroBe 4 Bytes, Ausrichtung 1 Byte. 

15 

Abschnitte 

Eine Ausfuhrungsform der vorliegenden Erfindung fugt einen neuen Abschnitt hinzu, der FPGA-Bitstromdaten ent- 
halt, mit dem Namen .ICARUS. bitstream. Einer oder mehrere solcher Abschnitte konnen voigesehen sein. Bei der be- 

20 vorzugten Ausfuhrungsform ist jeder solcher Abschnitte vom ELF-Abschnittstyp SHT_PROGBITS und besitzt das 
ELF-Abschnittsattribut SHF_ALLOC.SHT_PROGBITS bezeichnet einen Abschnitt, der Information enthalt, die durch 
das Programm festgelegt wird, deren Format und Bedeutung ausschlieBlich iiber das Prograrnm festgelegt wird. Attribut 
SHF_ALLOC spezifiziert, daB der Abschnitt wahrend der Vbrgangsausfuhrung einen Speicher besetzt, Information, die 
fur das Ladeprogramm niitzlich sein kann. 

25 Weil ELF mehrere Beispiele fur einen Abschnitt mit einem bestimmten Namen erlaubt, kann die vorliegende Erfin- 
dung einen Abschnitt pro Bitstrom verwenden, oder kann alternativ alle Bitstrome in einen Abschnitt mit geeigneter 
Ausrichtung verbinden. 

Es ist vorteilhaft, fur einen neuen Abschnitt fur Bitstrome zu sorgen, so daB Hardware mit spezielien Speicherberei- 
chen fur Bitstrome hergestellt werden kann. Der separate Abschnitt erleichtert die Plazierung von Bitstromen in diesen 
30 spezielien Speicherbereichen mit Hilfe des Ladeprogramms. Falls solche Speicherbereiche nicht erforderlich sind, kann 
die vorliegende Erfindung unter Verwendung eines Standard-Datenabschnitts fur Nur-Lese-Programmdaten realisiert 
werden, wie beispielsweise .rodata und .rodatal, wie in System V Application Binary Interface beschrieben ist, anstatt 
das spezielle Bitstromabschnitte eingefiihrt werden. 

35 Symbole 

Objektdateien enthalten Symboltabellen, die Information zur Lokalisierung bzw. Fixierung und zur Verse hiebung der 
Symboladressen und Verweise eines Programrns halten. In einer Ausfuhrungsform der vorliegenden Erfindung besitzt je- 
der Bitstrom, der in dem Abschnitt .ICARUS.bitstream enthalten ist, einen Eintrag in der Syrnboltabelle der Objektdatei. 
40 In der Binden-Ansicht 501 aus Fig, 5 ist die Syrnboltabelle in einem separaten Abschnitt 505 lokalisiert. Das Symbol hat 
die folgenden Attribute: 

- st_name: Der Name des Symbols ist der Name, der verwendet wird, um es in der Maschinensprachenquelle fur 
die Objektdatei zu referenzieren. st_name enthalt einen Index in die Symbolstringtabelle der Objektdatei, die die 

45 Zeichendarstellungen der Symbolnamen enthalt. 

- st_value: Sorgt bei Bitstrom-Symbolen fiir den Versatz des Bitstroms innerhalb des Abschnittes. 

- st_size: GroBe des Bitstroms in Bits. 

- st_info: Spezifiziert den Typ und die Binde- Attribute. Ein neuer Typ wird verwendet, der als STT_BITSTREAM 
bezeichnet wird. Dieser neue T^p ist charakteristisch fiir die vorliegende Erfindung und zeigt an, daB dieses Symbol 

50 sich in einem FPGA-Bitstrom befindet. Der Binde vorgang legt die Sichtbarkeit der Bindung und das Verhalten fest 

und kann STB.LOCAL oder STB_GLOBAL sein. STB_LOCAL zeigt an, daB das Symbol nicht auBerhalb der Ob- 
jektdatei, die die Definition des Symbols enthalt, sichtbar ist. STB-GLOBAL zeigt an, daB das Symbol fiir alle Da- 
teien, die kombiniert werden, sichtbar ist. Fiir Bitstrom-Symbole kann das Binden entweder STB_LOCAL oder 
STB-GLOBAL sein. Weil Bitstrome fur gewohnlich von mehr als einem Codeabschnitt verwendet werden und des- 

55 halb in eine Bibliothek zur Wiederverwendung iibersetzt werden konnen, ist es wahrscheinlicher, daB STB-GLO- 

BAL verwendet wird. 



Verschiebungen (Relocations) 

60 

Verschiebung ist der Vorgang der Verbindung symbolischer Referenzen mit symbolischen Definitionen. Verschiebbare 
Dateien enthalten Verschiebungen bzw. Programmverschiebungen, die Daten darstellen, die beschreiben, wo spezielle 
symbolische Definitionen gefunden werden konnen,. so daB der Binder diese lokalisieren kann. Spezielle Verschiebung s- 
vorgange variieren von ISA zu ISA, wie dies auch bei S tan dard-ELF- Dateien der Fall ist. \ferschiebungstypen sind in- 
65 nerhalb der Felder r_info von ICARUS_ELF_REL-S trukturen und ICARUS_ELF_RELA-Strukturen enthalten. Bei- 
spiele fur solche Verschiebungstypen urnfassen: 

- ICARUS_64_BIT_ADDR: 64-Bitadressen, die zum Zeitpunkt der Ubersetzung bestimmt werden. lypischer- 
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weise gemeinsam mit der eldi-Anweisung in den Prozessor geladen. 

- ICARUS_64_BIT^OFFSET: RelativadreBversatz von augenblicklicher NTPAR-Stelle zu einem Symbol, typi- 
schenveise einem Kennzeichen (label). Von den br-Anweisungen (branch; Programmverzweigung) verwendet. 

Aus den genannten Griinden macht erfindungsgemaB das zuvor beschriebene ICARUS ELF-Objektdateiformat neu- 5 
artigen Gebrauch von der Softwarebindungstechnologie, urn Computerprogramme gemeinsam mit der Hardwarekonfi- 
guration zusammenzufugen, auf der das Progranun lauft, wobei ein rekonfigurierbarer Computer 10 verwendet wird, wie 
er zuvor beschrieben wurde. Das System und das Verfahren gemaB der vorliegenden Erfindung kann eine Kompilierung 
fur Mehrfach-ISAs innerhalb einer einzigen Quelldatei ausfuhren und ist bei einer Ausfuhrungsform in der Lage, Ma- 
schinenanweisungen und Daten gemeinsam mit Hardwarekonfigurationen zusammenzufugen, die erforderlich sind, um 10 
die Maschineninstruktionen auszufuhren. 

Nachfolgend wird anhand der Fig. 9 bis 25B eine bevorzugte Hardware-Umgebung beschrieben, in der die Erfindung 
bevorzugt angewendet wird. 

In Fig. 9 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform eines Systems 3010 fur ein skalierbares, paral- 
leles, dynamisch rekonfigurierbares Berechnen dargestellt, das gemaB der Erfindung ausgefuhrt wird. Das in Fig. 9 ge- 15 
zeigte System 3010 entspricht im wesentlichen dem in Fig. 1 gezeigten System 10. Das System 3010 weist vorzugsweise 
zumindest eine S-Einrichtung 3012, eine T-Einrichtung 3014 entsprechend jeder S-Einrichtung 3012, eine universelle 
Verbindungsmatrix (GPIM) 3016, zumindest eine Ein-/Ausgabe-T-Einrichtung 3018, ein oder mehrere Ein-/Ausgabe- 
vorrichtungen 3020 und eine Master-Zeitbasiseinheit 3022 auf. In der bevorzugten Ausfuhrungsform weist das System 
3010 mehrere S-Einrichtungen 3012 und folglich mehrere T-Einrichtungen 3014 plus mehrere Ein-/Ausgabe-T-Einrich- 20 
tungen 3018 und mehrere Ein-/Ausgabe-Vorrichtungen 3020 auf. 

Jede der S-Einrichtungen 3012, der T-Einrichtungen 3014 und der Ein-/Ausgabe-T-Einrichtungen 3018 hat einen Ma- 
ster- Zeitsteuereingang, der mit einem Zeitsteuerausgang der Master-Zeitbasiseinheit3022 verbunden ist. Jede S-Einrich- 
tung 3012 hat einen Eingang und einen Ausgang, der rnit der entsprechenden T-Einrichtung 3014 verbunden ist. Zusatz- 
lich zu dem Eingang und dem Ausgang, der rnit der entsprechenden S-Einrichtung 3012 verbunden ist, hat jede T-Ein- 25 
richtung 3014 einen Leiteingang und einen Leitausgang, welche mit der GPI-Matrix 3016 verbunden sind. Dementspre- 
chend hat jede Ein-/Ausgabe-T-Einrichtung 3018 einen Eingang und einen Ausgang, welcher mit einer Ein-/Ausgabe- 
Vorrichtung 3020 verbunden ist, und einen Leiteingang und einen Leitausgang, der mit der GPI-Matrix 3016 verbunden 
ist. 

Wie unten im einzelnen noch beschrieben wird, ist jede S-Einrichtung 3012 ein dynamisch rekonfigurierbarer Rech- 30 
ner. Die GPI-Matrix 3016 stellt ein paralleles Punkt-zu-Punkt-Verbindungsmittel dar, welches eine Kommunikation zwi- 
schen T-Einrichtungen 3014 erleichtert. Der Satz T-Einrichtungen 3014 und die GPI-Matrix 3016 bilden ein paralleles 
Punkt-zu-Punkt-Verbindungsmittel fur einen Datentransfer zwischen S-Einrichtungen 3012. In ahnlicher Weise bilden 
die GPI-Matrix 3016, der Satz T-Einrichtungen 3014 und der Satz Ein-/Ausgabe-T-Einrichtungen 3018 ein paralleles 
Punkt-zu-Punkt-Verbindungsmittel fur einen Ein-/Ausgabe-Transfer zwischen S-Einrichtungen 3012 und jeder Ein- 35 
/Ausgabevorrichtung 3020. Die Master-Zeitbasiseinheit 3022 weist einen Oszillator auf, der ein Master-Zeitsteuersignal 
zu jeder S-Einrichtung 3012 und jeder T-Einrichtung 3014 schafft. 

In einer beispielhaften Ausfuhrungsform ist jede S-Einrichtung 3012 durch Verwenden eines Xilinx C4013 (Xilinx, 
Inc., San Jose, CA) feldprogrammierbaren Gate- Array (FPGA) ausgefuhrt, das mit einem 64 Megabyte Randomspeicher 
(RAM) verbunden ist. Jede T-Einrichtung 3014 ist durch Verwenden von annahemd 50% der rekonfigurierbaren Hard- 40 
ware-Ressourcen in einem Xilinx XC4013 FPGA ausgefuhrt, ebenso jede Ein-/Ausgabe-T-Einrichtung 3018 ist. Die 
GPI-Matrix 3014 ist als ein ringfbrmiges Verbindungsmaschennetz ausgefuhrt. Die Master-Zeitbasiseinheit 3020 ist ein 
Taktoszillator, der vorgesehen ist, um eine Verteilungsschaltung zu takten, um eine systemweite Frequenzreferenz zu 
schaffen. Vorzugsweise ubertragen die GPI-Matrix 3014 die T-Einrichtung 3012 und die Bn-/Ausgabe-T-Einrichtung 
3018 Information entsprechend ANSIflEEE-Standard 1596 bis 1992, wodurch ein skalierbares koharentes Interface 45 
(SCI) definiert ist. 

In der bevorzugten Ausfuhrungsform weist das System 3010 mehrere S-Einrichtungen 3012 auf, welche parallel ar- 
beiten. Der Aufbau und die Funktionalitat jeder der einzelnen S-Einrichtungen 3012 wird im einzelnen anhand von Fig. 
lObis 20B beschrieben. In Fig. 10 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer S-Einrichtung 3012 
dargestellt. Die S-Einrichtung 3012 weist eine erste lokale Zeitbasiseinheit 3030, eine dynamisch rekonfigurierbare Ver- 50 
arbeitungs-(DRP-)Einheit 3032 zum Ausfuhren von Programmbefehlen und einen Speicher 3034 auf. Die erste lokale 
Zeitbasiseinheit 303 hat einen Zeitsteuereingang, welche den Master-Zeitsteuereingang der S-Einrichtung bildet. Die er- 
ste lokale Zeitbasiseinheit 3030 hat auch einen Zeitsteuerausgang, der ein erstes lokales Zeitsteuersignal oder ein Takt- 
signal an einem Zeitsteuereingang der DRP-Einheit 3032 und an einem Zeitsteuereingang des Speichers 3034 iiber eine 
erste Zeitsteuerleitung 3040 schafft. Die DRP-Einheit 3032 hat einen Steuersignal- Ausgang, der mit einem Steuersignal- 55 
eingang des Speichers 3034 iiber eine Speichersteuerleitung 3042 verbunden ist, einen Adressenausgang, der mit einem 
Adresseneingang des Speichers 3034 iiber eine Adressenleitung 3044 verbunden ist, und einen zweiseitig gerichteten 
Steuerport, der mit einem zweiseitig gerichteten Steuerport des Speichers 3034 iiber eine Speicher-Ein-/Ausgabeleitung 
3046 verbunden ist. Die DPR-Einheit 3032 hat zusatzlich einen zweiseitig gerichteten Steuerport, der iiber einen zwei- 
seitig gerichteten Steuerport der entsprechenden T-Einrichtung 3014 tiber eine externe Steuerleitung 3048 verbunden ist. 60 
Wie in Fig. 10 dargestellt, uberspannt die Speichersteuerleitung 3042 X-Bits; die Adressenleitung 3044 uberspannt M- 
Bits; die Speicherein-/Ausgabeleitung 3046 uberspannt (N x k) Bits und die externe Steuerleitung 3048 uberspannt Y- 
Bits. 

In der bevorzugten Ausfuhrungsform empfangt die erste lokale Zeitbasiseinheit 3030 das Master-Zeitsteuersignal 
bzw. Master-Taktsignal von der Master-Zeitbasiseinheit 3022. Die erste lokale Zeitbasiseinheit 3030 erzeugt das erste lo- 65 
kale Zeitsteuersignal auf dem Master-Zeitsteuersignal und gibt das erste lokale Zeitsteuersignal an die DRP-Einheit 3032 
und den Speicher 3034 ab. In der bevorzugten Ausfuhrungsform kann sich das erste lokale Zeitsteuersignal von einer S- 
Einrichtung 3012 zur anderen andem. Folglich arbeiten die DRP-Einheit 3032 und der Speicher 3034 in einer vorgege- 
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benen S-Einrichtung 3012 mit einer unabhangigen Taktrate beziiglich der DRP-Einheit 3032 und dem Speicher 3034 in 
einer anderen S-Einrichtung 3012. Vorzugsweise ist das erste lokale Zeitsteuersignal phasensynchronisiert mit dem Ma- 
ster-Zeitsteuersignal. In der bevorzugten Ausfuhrungsform ist die erste lokale Zeitbasiseinheit 3030 durch Verwenden ei- 
ner phasengekoppelten Frequenzumwandlungsschaltung ausgefuhrt, die eine phasengekoppelte Detektionsschaltung 
5 enthalt, die mit Hilfe von rekonfigurierbaren Hardware-Ressourcen ausgefuhrt ist. Der Fachmann weiB, daB in einer al- 
ternativen Ausfuhrungsform die erste lokale Zeitbasiseinheit 3030 auch als ein Teil eines Taktverteilungsbaums ausge- 
fuhrt sein konnte. 

Der Speicher 3034 ist vorzugsweise als ein RAM ausgefuhrt und speichert Programmbefehle, Programmdaten und 
Konfigurationsdatensatze fur die DRP-Einheit 3032. Der Speicher 3034 einer vorgegebenen S-Einrichtung 3012 ist vor- 

10 zugsweise fur eine andere S-Einrichtung 3012 in dem System 3010 iiber die GPI-Matrix 3016 zuganglich. Dariiber hin- 
aus ist jede S-Einrichtung 3012 vorzugsweise dadurch gekennzeichnet, daB sie einen gleichformigen Speicheradressen- 
platz hat. In der bevorzugten Ausfuhrungsform enthalten Programmbefehle, die in dem Speicher 3040 selektiv gespei- 
chert sind, Rekonfigurationsanweisungen, die in Richtung der DRP-Einheit 3032 gerichtet sind. 

In Fig, 11 A weist die beispielhafte Programmauflistung 3050 einen Satz AuBenschleifenteile 3052, sowie erste bis 

15 funfte Innenschleifenteile 3050 bis 3057 auf. Wie der Fachmann weiB, verweist der Begriff "Innenschleife" auf einen ite- 
rativen Teil eines Programms, das dafiir verantwortlich ist, einen ganz bestimmten Satz verwandter Operationen durch- 
zufuhren, und der BegrifF "AuBenschleife" verweist auf die Teile eines Programms hin, die hauptsachlich dafiir verant- 
wortlich sind, universelle Operationen und/oder eine Ubertragungssteuerung von einem Innenschleifenteil zu einem an- 
deren durchzufuhren. Irn allgemeinen fuhren Innenschleifenteile 3054 bis 3058 eines Programms spezifische Operatio- 

20 nen an rnoglicherweise groBen Datensatzen durch. Bei einer Bildverarbeitungsanwendung kann der erste innere Schlei- 
fenteil 3054 Farbformat-Umsetzoperationen an Bilddaten durchfuhren, und die zweiten bis funften Innenschleifenteile 
3055 bis 3058 konnen eine lineare Filterung, eine Faltung, Mustersuch- und Kompressionsoperationen durchfuhren. Wie 
der Fachmann weiB, kann eine aneinanderhangende Folge von Innenschleifenteilen 3055 bis 3058 als eine Software- 
Pipeline betrachtet werden. Jeder AuBenschleifenteil 3052 wiirde fur eine Daten-Ein-/Ausgabe und/oder fur ein Leiten 

25 der Dateniibertragung und ein Steuem von dem ersten Innenschleifenteil 3054 zu dem zweiten Innenschleifenteil 3055 
verantwortlich sein. Zusatzlich erkennt der Fachmann, daB ein vorgegebener Innenschleifenteil 3054 bis 3058 eine oder 
mehrere Rekonfigurationsanweisungen enthalten kann. Im allgemeinen werden fur ein vorgegebenes Programm die Au- 
Benscheifenteile 3052 der Programmauflistung 3050 eine Vielfalt von universellen Befehlstypen enthalten, wahrend die 
Innenschleifenteile 3054, 3056 der Programmauflistung 3050 aus verhaltnismaBig wenigen Befehlstypen bestehen, die 

30 verwendet werden, um eine spezifische Menge an Operationen durchzufuhren. 

In einer beispielhaften Programmauflistung 3050 erscheint eine erste Konfigurationsanweisung am Anfang des ersten 
Innenschleifenteils 3054, und eine zweite Rekonfigurationsanweisung erscheint am Ende des ersten Innenschleifenteils 
3054. Dementsprechend erscheint eine dritte Konfigurationsanweisung zu Beginn des zweiten Innenschleifenteils 3055; 
eine vierte Rekonfigurationsanweisung erscheint zu Beginn des dritten Innenschleifenteils 3056; eine funfte Rekonfigu- 

35 rationsanweisung erscheint zu Beginn des vierten Innenschleifenteils 3057 und eine sechste und siebte Rekonfigurations- 
anweisung erscheint am Anfang bzw. am Ende des fiinflen Innenschleifenteils 3058. Jede Rekonfigurationsanweisung 
verweist vorzugsweise auf einen Rekonfigurationsdatensatz, welcher eine interne DRPU-Hard ware-Organisation spezi- 
fiziert, die auf die Ausfuhrung einer ganz bestimmen Befehlssatz-Architektur (ISA) gewidmet und dafiir optimiert wor- 
den ist. Eine IS-Architektur ist ein Stamrn- oder Kernsatz von Informationen, die verwendet werden konnen, um einen 

40 Rechner zu programmieren. Eine IS-Architektur definiert Befehlsformate, Operationscodes, Datenformate, Adressier- 
modes, Ausfiihrungs-Steuerflags und programmzugangliche Register. Der Fachmann weiB, daB dies der herkomrnlichen 
Definition einer IS-Architektur entspricht. In der vorliegenden Erfindung kann jede DRP-Einheit 3032 einer S-Einrich- 
tung schnell laufzeit-konfiguriert werden, um direkt Mehrfach-IS-Architekturen durch die \ferwendung eines eindeuti- 
gen Konfigurauonsdatensatzes fiir jede gewunschte IS-Architektur auszufuhren. Das heiBt, jede IS-Achitektur wird mit 

45 einer eindeutigen internen DRPU-Hardware-Organisation durchgefiihrt, wie die durch einen entsprechenden Konfigura- 
tionsdatensatz spezifiziert ist Folglich entsprechen in der vorliegenden Erfindung die ersten bis funften Innenschleifen- 
teile 3054 bis 3058 jeweils einer eindeutigen IS-Architektur, namlich ISA 1, 2, 3, 4 bzw. k. Der Fachmann erkennt, daB 
jede nachfolgende IS-Architektur nicht eindeutig zu sein braucht. Folglich konnte ISA k ISA 1, 2, 3, 4 oder irgendeine 
andere ISA sein. Der Satz AuBenschleifenteile 3052 entspricht auch einer eindeutigen ISA, namlich ISA 0. In der bevor- 

50 zugten Ausfuhrungsform kann wahrend einer Programmausfuhrung die Auswahl von aufeinanderfolgenden Rekonfigu- 
rationsanweisungen datenabhangig sein. Bei Auswahl einer vorgegebenen Rekonfigurationsanweisung werden Pro- 
grammbefehle nacheinander gemaB einer entsprechenden IS-Architektur iiber eine eindeutige DRPU-Hardware-Konfi- 
guration ausgefuhrt, was durch einen entsprechenden Konfigurations-Datensatz spezifiziert ist. 

In der Erfindung kann eine vorgegebene IS-Architektur als eine Innenschleifen-IS-Architektur oder als eine AuBen- 

55 schleifen-IS-Architektur entsprechend der Anzahl und den TVpen von Befehlen, welche sie enthalt, in Kategorien einge- 
teilt werden. Eine IS-Architektur, die mehrere Befehle enthalt und die zum Durchfuhren genereller Operationen brauch- 
bar ist, ist eine AuBenschleifen-ISA, wahrend eine ISA, die aus relativ wenigen Befehlen besteht und die darauf ausge- 
richtet ist, spezifische Operationstypen durchzufuhren, eine Innenschleifen-ISA ist. Da eine AuBenschleifen-ISA darauf 
gerichtet ist, generelle Operationen durchzufuhren, ist eine AuBenschleifen-ISA am zweckdienlichsten, wenn eine par- 

60 allele Programm-Befehlsausfuhrung wiinschenswert ist. Die Wirksamkeit einer Ausfuhrung einer Innenschleifen-ISA ist 
vorzugsweise hinsichtlich Befehlen gekennzeichnet, die pro Taktzyklus durchgefiihrt werden oder hinsichtlich rechten 
Ergebnissen gekennzeichnet, die pro Taktzyklus erzeugt worden sind. 

Der Fachmann erkennt, daB die vorhergehende Erorterung einer sequentiellen Programmbefehlsausfiihrung und einer 
parallelen Programmbefehlsausfiihrung eine Programmbefehlsausfiihrung mit einer einzigen DRP-Einheit 3032 betriff t. 

65 Das Vorhandensein von mehreren S-Einrichtung Rekonfigurationsanweisungen 3012 in dem System 3010 erleichtert die 
parallele Ausfuhrung von mehreren Programmbefehlsfolgen in einer vorgegebenen Zeit, wobei jede Programmbefehls- 
folge durch eine vorgegebene DRP-Einheit 3032 durchgefiihrt wird. Jede DRP-Einheit 3032 ist entsprechend konfigu- 
riert, um eine parallele oder serielle Hardware zu haben, um eine ganz bestimmte Innenschleifen-ISA bzw. eine AuBen- 
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schleifen-ISA in einer ganz bestimmten Zeit durchzufuhren. Die interne Hardware- Konfiguration einer vorgegebenen 
DRP-Einheit 3032 andert sich mit der Zeit entsprechend der Auswahl von einer oder mehreren Rekonfigurationsanwei- 
sungen, die in eine Folge von durchzufuhrenden Programmbefehlen eingebettet sind. 

In einer bevorzugten Ausfuhrungsform sind jede IS-Architektur und deren entsprechende interne DRPU-Hard ware- 
Organisation entsprechend ausgelegt, um eine optimale Rechenleistung fur eine ganz bestimmte Klasse von Rechenpro- 5 
blemen bezuglich einer Menge verfiigbarer rekonfigurierbarer Hardware-Ressourcen zu schaffen. Wie vorher bereits er- 
wahnt und wie nunmehr nachstehend im einzelnen naher beschrieben wird, ist eine interne DRPU- Hardware-Organisa- 
tion, die einer AuBenschleifen-ISA entspricht, vorzugsweise for eine sequentielle Prograrnmbefehlsausfuhrung opti- 
miert, und eine interne DRPU-Hardware-Organisation, die einer Innenschleifen-ISA entspricht, ist vorzugsweise fur eine 
parallele Prograrnmbefehlsausfuhrung optimiert. 10 

Mit Ausnahme jeder Rekonfigurationsanweisung weist die beispielhafte Programmauflistung 3050 der Fig. 11 A vor- 
zugsweise herkommliche Hochsprachenangaben auf, beispielsweise Angaben die entsprechend der C-Programmierspra- 
che geschrieben sind. Der Fachmann erkennt, daB das Einbeziehen von einer oder mehreren Rekonfigurationsanweisun- 
gen in eine Folge von Programmbefehlen einen Compiler erfordert, der rnodifiziert ist, um fur die Rekonfigurationsan- 
weisungen verantwortlich zu sein. 15 

In Fig. 11B ist ein FluBdiagramm von herkonunlichen Compilieroperationen dargestellt, die wahrend des Compilie- 
rens bzw. Ubersetzens einer Folge von Programmbefehlen durchgefuhrt worden sind. Hierbei entsprechen die herkomm- 
lichen Compilieroperationen im allgemeinen denjenigen, die von dem GNU C Compiler (GCC) durchgefuhrt worden 
sind, der von der Free Software Foundation (Cambridge, MA) hergestellt worden ist. Der Fachmann weiB, daB die her- 
kommlichen Compilieroperationen, die unten beschrieben werden, ohne weiteres fur andere Compiler verallgemeinert 20 
werden konnen. Die herkommlichen Compilieroperationen beginnen beim Schritt 3500 mit dem Compiler-Frontende, 
das eine nachste Hochsprachen-Anweisung fur eine Folge von Programmbefehlen auswahlt. Als nachstes erzeugt das 
Compiler-Frontende beim Schritt 3502 einen Zwischencode, der der ausgewahlten Hochsprachen-Anweisung entspricht, 
welche im Falle von GCC Register-Transterpegel-(RTL-)Angaben entspricht. Im AnschiuB an den Schritt 3502 bestimmt 
das vordere Compilerende, ob eine andere Hochsprachen-Anweisung eine Beachtung beim Schritt 3504 erfordert. Wenn 25 
dem so ist, kehrt das bevorzugte Verfahren auf den Schritt 3500 zuriick. 

Wenn beim Schritt 3504 das vordere Compilerende bestimmt, daB keine andere Hochsprachenanweisung Beachtung 
erfordert, fuhrt das hintere Compilerende als nachstes herkommliche Registerzuordnungsoperationen beim Schritt 3605 
durch. Nach dem Schritt 3506 wahlt das hintere Compilerende eine nachste RTL-Angabe hinsichtlich einer aktuellen 
RTL-Anweisungsgruppe beim Schritt 3508 aus. Das hintere Compilerende bestimmt dann, ob eine Vorschrift, die eine 30 
Art und Weise spezifiziert, in welcher die aktuelle RTL-Anweisungsgruppe in einen Satz von Assemblersprachen-An- 
weisungen ubersetzt werden kann, beim Schritt 3510 vorhanden ist. Wenn eine derartige Vorschrift nicht vorhanden ist, 
kehrt das bevorzugte Verfahren auf den Schritt 3508 zuriick, um eine andere RTL-Anweisung fur ein Einbeziehen in die 
aktuelle RTL-Anweisungsgruppe auszuwahlen. Wenn eine Vorschrift, die der aktuellen RTL-Anweisungsgruppe ent- 
spricht, existiert, erzeugt das hintere Compilerende beim Schritt 3512 einen Satz Assemblersprachen-Anweisungen ent- 35 
sprechend der Vorschrift. Nach dem Schritt 3512 stellt das hintere Compilerende fest, ob eine nachste RTL-Anweisung 
Beachtung im Kontext mit einer nachsten RTL-Anweisungsgruppe erfordert. Wenn dem so ist, kehrt das bevorzugte Ver- 
fahren auf Schritt 3508 zuriick; andemfalls ist das bevorzugte Verfahren beendet. 

Die vorliegende Erfindung enthalt vorzugsweise einen Compiler fiir ein dynamisch rekonfigurierbares Berechnen. In 
Fig. 11C und 11D ist ein FluBdiagramm von bevorzugten Compilieroperationen dargestellt, die von einem Compiler fur 40 
ein dynamisch rekonfigurierbares Berechnen durchgefuhrt worden sind. Die bevorzugten Compileroperationen beginnen 
beim Schritt 3600 mit dem vorderen Ende des Compilers, der eine nachste Hochsprachen-Anweisung in einer Folge von 
Programmbefehlen auswahlt Als nachstes bestimmt das vordere Ende des Compilers beim Schritt 3602, ob die ausge- 
wahlte Hochsprachen-Anweisung eine Rekonfigurationsanweisung ist. Wenn dem so ist, erzeugt das vordere Ende des 
Compilers eine RTL-Regkonfigurationsanweisung beim Schritt 3604, worauf dann das bevorzugte Verfahren auf Schritt 45 
3600 zuriickkehrt. In der bevorzugten Ausfuhrungsform ist die RTL-Rekon fig urationsanweisung eine nichtnormierte 
RTL-Anweisung, die einen ISA-Identifizierung erhalt Wenn beim Schritt 3602 die ausgewahlte Hochprogramm-Anwei- 
sung nicht eine Rekonfigurationsanweisung ist, erzeugt das vordere Ende des Compilers als nachstes einen Satz KTL- 
Anweisungen in herkommlicher Weise beim Schritt 3606. Nach dem Schritt 3606 bestimmt das vordere Ende des Com- 
pilers beim Schritt 3608, ob eine andere Hochsprachen-Anweisung Beriicksichtigung erfordert. Wenn dem so ist, kehrt 50 
das bevorzugte Verfahren auf den Schritt 3600 zuriick; anderenfalls geht das bevorzugte Verfahren auf Schritt 3610 uber, 
um Operationen am Compilerende zu initiieren. 

Beim Schritt 3610 fuhrt das hintere Ende des Compilers fur ein dynamisch rekonfigurierbares Berechnen Register-Zu- ■ 
ordnungsoperationen durch. In der bevorzugten Ausfuhrungsform der Erfindung ist jede ISA-Architektur so definiert, 
daB die Register- Architektur von einer IS-Architektur zur anderen folgerichtig ist; daher werden Register-Zuordnungs- 55 
operationen in herkommlicher Weise durchgefuhrt. Der Fachmann erkennt, daB im allgemeinen eine folgerichtige Regi- 
ster- Architektur von einer ISA zur anderen keine absolute Forderung ist. Als nachstes wahlt das hintere Ende des Com- 
pilers eine nachste RTL-Anweisung in einer aktuell in Betracht gezogenen RTL-Anweisungsgruppe beim Schritt 3612 
aus. Das hintere Ende des Compilers bestimmt dann beim Schritt 3614, ob die ausgewahlte RTL-Anweisung eine RTL- 
Rekonfigurationsanweisung ist. Wenn die ausgewahlte RTL-Anweisung nicht eine RTL-Rekonfigurauonsanweisung ist, 60 
bestimmt das hintere Ende des Compilers beim Schritt 3618, ob eine Vorschrift fur die aktuell in Betracht gezogene RTL- 
Anweisungsgruppe existiert. Wenn dem nicht so ist, kehrt das bevorzugte Verfahren auf den Schritt 3612 zuriick, um eine 
nachste RTL-Anweisung fiir ein Einbeziehen in die aktuell in Betracht gezogene RTL-Anweisungsgruppe zu wahlen. In 
dem Fall, daB eine Vorschrift fur die aktuell in Betracht gezogene RTL-Anweisungsgruppe beim Schritt 3618 existiert, 
erzeugt das hintere Ende des Compilers als nachstes einen Satz Assemblersprachen-Anweisungen beim Schritt 3620, 65 
welche der aktuell in Betracht gezogenen RTL-Anweisungsgruppe gemaB dieser Vorschrift entsprechen. Nach dem 
Schritt 3620 bestimmt das hintere Ende des Compilers beim Schritt 3622, ob eine andere RTL-Anweisung eine Beriick- 
sichtigung im Kontext mit einer nachsten RTL-Anweisungsgruppe erfordert. Wenn dem so ist, kehrt das bevorzugte Ver- 
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fahren auf den Schritt 3612 zuriick; anderenfalls endet das bevorzugte Verfahren. 

Wenn beim Schritt 3614 die ausgewahlte RTL-Anweisung eine RTL-Rekonfigurationsanweisung ist, wahlt das hintere 
Ende des Compilers einen Vorschriftensatz beim Schritt 3616 aus, welcher der ISA-Identifizierung der RTL-Rekonfigu- 
rationsanweisung entspricht. In der vorliegenden Erfindung existiert vorzugsweise ein eindeutiger Vorschriftensatz fur 
5 jede ISA. Jeder Vorschriftensatz schafft daher eine oder mehrere Vorschriften, um Gruppen von RTL-Anweisungen in 
Assemblersprachen-Anweisungen entsprechend einer ganz bestimmten IS-Architektur umzuwandeln. Nach dem Schritt 
3616 geht das bevorzugte Verfahren auf Schritt 3618 uber. Der Vorschriftensatz, der einer vorgegebenen IS-Architektur 
entspricht, enthalt vorzugsweise ein Vorschrift, um die RTL-Rekonfigurationsanweisung in einen Satz Assemblerspra- 
chen-Befehle zu ubersetzen, die eine Software-Unterbrechung erzeugen, die auf eine Durchfuhrung eines Rekonfigura- 

10 tions-Abwicklers (handler) hinauslauft, wie im einzelnen unten beschrieben wird. 

In der vorstehend beschriebenen Weise erzeugt der Compiler fur dynamisch rekonfigurierbares Berechnen selektiv 
und automatisch Assemblersprachen-Anweisungen entsprechend mehreren IS-Architekturen wahrend Compileropera- 
tionen. Mit anderen Worten, wahrend des Compilerprozesses ubersetzt der Compiler einen einzigen Satz Programmbe- 
fehlen entsprechend einer variabien IS-Architektur. Der Compiler ist vorzugsweise ein herkommlicher Compiler, der 

15 modifiziert worden ist, um bevorzugte Compileroperationen durchzufuhren, die vorstehend unter Bezugnahme auf Fig. 
11C und 11D beschrieben worden sind. Der Fachmann erkennt, daB, obwohl die geforderten Modiflkationen nicht kom- 
plex sind, solche Modiflkationen im Hinblick sowohl auf herkommliche Compilertechniken als auch im Hinblick auf 
herkommliche rekonfigurierbaren Berechnungsmethoden nicht offensichtlich und naheliegend sind. 

In Fig. 12 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer dynamisch rekonfigurierbaren Verarbei- 

20 tungseinheit 3032 dargestellt. Die DRP-Einheit 3032 weist eine Befehlsabruf-(IF-)Einheit 3016, eine Datenoperations- 
(DO-)Einheit 3062 und eine Adressenoperations-(AO)Einheit 3064 auf. Jede der IF-Einheiten 3060, der DOEinheiten 
3062 und der AO-Einheiten 3064 hat einen Zeitsteuereingang, welcher mit der ersten Zeitsteuersignalleitung 3040 ver- 
bunden ist. Die EF-Einheit 3060 hat einen Speichersteuerausgang, welcher mit der Leitung 3042 verbunden ist, einen Da- 
teneingang, der mit einer Leitung 3046 verbunden ist, und einen zweigerichteten Steuereingang, der mit der extemen 

25 Steuerleitung 3048 verbunden ist. Die IF-Einheit 3060 hat zusatzlich einen ersten Steuerausgang, der mit einem ersten 
Steuereingang der DO-Einheit 3062 uber eine erste Steuerleitung 3070 verbunden ist, und einen zweiten Steuerausgang, 
der mit einem ersten Steuereingang der AOEinheit 3064 uber eine zweite Steuerleitung 3072 verbunden ist. Die IF-Ein- 
heit 3060 hat auch einen dritten Steuerausgang, der mit einem zweiten Steuereingang der DO-Einheit 3062 und mit ei- 
nem zweiten Steuereingang der AOEinheit 3064 uber eine dritte Steuerleitung 3074 verbunden ist. Die DOEinheit 

30 3062 und die AOEinheit 3064 haben jeweils einen zweigerichteten Dateneingang, der mit der Speicher-Ein-/Ausgabe- 
leitung 3064 verbunden ist. SchlieBlich hat die AOEinheit 3064 einen Adressenausgang, welcher den Adressenausgang 
der DRP-Einheit bildet. 

Die DRP-Einheit 3032 ist vorzugsweise unter Verwendung einer rekonfigurierbaren oder umprogrammierbaren Lo- 
gikvorrichtung, beispielsweise einer FPGA, wie einer Xilinx XC4013 (Xilinx, Inc., San Jose, CA) oder einer AT&T 

35 ORCA™ 1C07 (AT&T Microelectronics, Allentown, PA) durchgefuhrt. Vorzugsweise schafft die umprogrammierbare 
Logikvorrichtung eine Anzahl von 1) selektiv umprogrammierbaren Logikblocken oder konfigurierbaren Logikblocken 
CLB), von 2) selektiv programmierbaren Ein-/Ausgabe-B16cken (IOB), von 3) selektiv umprogrammierbaren Verbin- 
dungsstrukturen, von 4) Datenspeicher-Ressourcen, von 5) Puffer-Ressourcen mit drei Zustanden und von 6) verdrahte- 
ten logischen Funktionsmerkmalen. Jeder CLB enthalt vorzugsweise eine selektiv rekonfigurierbare Schaltungsanord- 

40 nung zum Erzeugen logischer Funktionen, zum Speichern von Daten und zum Lenken von Signalen. Der Fachmann 
weiB, daB eine rekonfigurierbare Datenspeicherschaltung auch in einem oder mehreren Datenspeicherblocken (DSB) ? die 
von der Gruppe CL-Blocken getrennt ist, in Abhangigkeit von der genauen Bemessung der zu verwendenden umpro- 
grammierbaren Logikvorrichtung enthalten sein kann. Hierbei ist angenommen, daB sich die rekonfigurierbare Daten- 
speicherschaltung in einer FPGA in den CL-Blocken befindet; das heiBt, das Vorhandensein von DS-B16cken wird nicht 

45 angenommen. Der Fachmann erkennt ohne weiteres, daB ein oder mehrere der hier beschriebenen Elemente, die eine auf 
CL-Blocken basierende, rekonfigurierbare Datenspeicherschaltung benutzen, eine auf DS-Bldcken basierende Schal- 
tungsanordnung in dem Fall benutzen konnen, daB DS-Blocke vorhanden sind. Jeder IOBlock enthalt vorzugsweise 
eine selektiv rekonfigurierbare Schaltungsanordnung, um Daten zwischen CL-Blocken und einem FPAG-Ausgangsan- 
schluBstift zu ubertragen. Ein Konfigurationsdatensatz definiert eine DRPU-Hardware-Konfiguration oder Organisation 

50 durch Spezifizieren von Funktionen, die in W-B16cken durchgefuhrt worden sind, sowie Verbindungen 1) in CL-B16k- 
ken, 2) zwischen CL-Blocken, 3) in IOBlocken, 4) zwischen IOBlocken und 5) zwischen CL- und IO-B16cken. Der 
Fachmann erkennt, daB uber einen Konfigurationsdatensatz, die Anzahl Bits jeweils in der Speichersteuerleitung 3042, 
der Adressenleitung 3044, der Speicherleitung 3046 und der extemen Steuerleitung 3048 rekonfigurierbar ist. Vorzugs- 
weise werden Konfigurationsdatensatze in einem oder mehreren Speichern 3034 der S-Einrichtung in dem System 3010 

55 gespeichert. Der Fachmann erkennt, daB die DRP-Einheit 3032 nicht auf eine auf FPGA basierende Ausfuhrung be- 
schrankt ist. Beispielsweise konnte die DRP-Einheit 3032 als eine auf einem RAM basierende Zustandseinrichtung aus- 
gefuhrt sein, die rnoglicherweise ein oder mehrere Hinweistabellen enthalt. Altemativ hierzu konnte die DRP-Einheit 
3032 mit Hilfe einer komplexen programmierbaren Logikvorrichtung (CPLD) ausgefuhrt sein. Jedoch wird der Fach- 
mann realisieren, daB einige der S-Einrichtungen 3012 des Systems 3010 DRP-Einheiten 3032 haben konnen, die nicht 

60 rekonfigurierbar sind. 

In einer bevorzugten Ausfuhrungsform sind die EF-Einheit 3060, die DO-Einheit 3062 und die AOEinheit 3064 je- 
weils dynamisch rekonfigurierbar. Folglich kann deren interne Hard ware- Kon figuration selektiv wahrend einer Pro- 
grammdurchfuhrung modifiziert werden. Die EF-Einheit 3060 richtet Befehlsabruf- und Decodieroperationen, Zugriffs- 
operationen, DRPU-Rekonfigurationsoperationen aus und gibt Steuersignale an die DOEinheit 3062 und die AOEin- 
65 heit 3064 ab, um eine Befehlsausfuhrung zu erleichtem. Die DOEinheit 3062 fuhrt Operationen einschlieBlich einer Da- 
tenberechnung durch und die AO-Einheit 3064 fuhrt Operationen einschlieBlich einer Adressenberechnung durch. Der 
innere Aufbau und die Arbeits weise der IF-Einheit 3060, der DOEinheit 3062 und der AOEinheit 3064 wird nunrnehr 
im einzelnen beschrieben. - - 
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In Fig. 13 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer Befehlsabruf-(IF-)Einheit 3060 darge- 
stellt. Die IF-Einheit 3060 weist einen Befehlszustands-Zuordner(lSS) 3100, einen Architekturbeschreibungsspeicher 
3101, eine Speicherzugriffslogik 3102, einen Rekonfigurationslogik 3104, eine Unterbrechungslogik 3106, eine Abruf- 
steuereinheit 3108, einen Befehlspuffer 3110, eine Decodiersteuereinheit 3112, einen Befehlsdecodierer 3114, einen 
Operauonscode-Speicherregistersatz 3116, einen Registerdatei-(RF-)Adressenregistersatz 3118, einen Konstanten-Regi- 5 
stersatz 3120 und einen ProzeBsteuer-Registersatz 3122 auf. Der IS-Zuordner 3100 hat einen ersten und zweiten Steuer- 
ausgang, welcher die ersten und zweiten Steuerausgange der IF-Einheit bildet und einen Zeitsteuereingang, welcher den 
Zeitsteuereingang der IF-Einheit bildet. Der IS-Zuordner 3100 hat auch einen Abruf/Decodier- Steuerausgang, der mit ei- 
nem Steuereingang der Abrufsteuereinheit 3108 und einem Steuereingang der Decodiersteuereinheit 3112 uber eine Ab- 
ruf-Decodier- Steuerleitung 3130 verbunden ist. Der IS-Zuordner 3100 hat zusatzlich einen zweigerichteten Steuerein- 10 
gang, der mit einem ersten zweigerichteten Steuereingang jeweils der Speicherzugrifflogik 3102, der Rekonfigurations- 
logik 3104 und der Unterbrechungslogik 3106 iiber eine zweigerichtete Steuerleitung 3132 verbunden ist Der IS-Zuord- 
ner 3100 hat auch einen Operationscode-Eingang, der mit einem Ausgang des Operationscode-Speicherregistersatzes 
3116 iiber eine Operationscode-Leitung 3142 verbunden ist. SchlieSlich hat der IS-Zuordner 3100 einen zweigerichteten 
Dateneingang, der mit einem zweigerichteten Dateneingang des ProzeBsteuer-Registersatzes 3122 iiber eine ProzeBda- 15 
tenleitung 3144 verbunden ist. 

Jeweils die Speicherzugriffslogik 3102, die Rekonfigurationslogik 3104 und die Unterbrechungslogik 3106 haben ei- 
nen zweiten zweigerichteten Steuereingang, welcher mit der extemen Steuerleitung 3048 verbunden ist. Die Speicherzu- 
griffslogik 3102, die Rekonfigurationslogik 3104 und die Unterbrechungslogik 3106 haben zusatzlich jeweils einen Da- 
teneingang, der mit einem Datenausgang des Architektur-Beschreibungsspeichers 3101 uber eine Steuerleitung 3138 20 
verbunden ist. Die Speicherzugriffslogik 3102 hat zusatzlich einen Steuerausgang, welcher den Speichersteuerausgang 
der IF-Einheit bildet, und die Unterbrechungslogik 3106 hat zusatzlich einen Ausgang, der mit der Prozefidatenleitung 
3144 verbunden ist. Der Befehlspuffer 3110 hat einen Dateneingang, welcher den Dateneingang der EF-Einheit bildet, ei- 
nen Steuereingang, der mit einem Steuerausgang der Abrufsteuereinheit 3108 iiber eine Abrufsteuerleitung 3134 verbun- 
den ist, und einen Ausgang, der mit einem Eingang des Befehlsdecodierers 3114 iiber eine Befehlsleitung 3136 verbun- 25 
den ist. Der Befehlscodierer 3114 hat einen Steuereingang, der mit einem Steuerausgang der Decodiersteuereinheit 3112 
iiber eine Decodiersteuerleitung 3138 verbunden ist, und einen Ausgang, der iiber eine Befehlsleitung 3140 mit 1) einem 
Ausgang des Operationscode-Speicherregisters 3116, mit 2) einem Eingang des HF-Adressenregistersatzes 3118 und 3) 
mit einem Eingang des Konstanten-Registersatzes 3120 verbunden ist. Der HF-Adressenregistersatz 3118 und der Kon- 
stanten-Registersatz 3120 haben jeweils einen Ausgang, die zusammen den dritten Steuerausgang 3074 der IF-Einheit 30 
bilden. 

Der Architektur-Beschreibungsspeicher 3101 speichert Architektur-Spezifikationssignale, welche die aktuelle DRPU- 
Konfiguration kennzeichnen. Vorzugsweise enthalten die Architektur-Spezifikationssignale 1) eine Referenz zu einem 
fehlerhaften Konfigurationsdatensatz, 2) eine Referenz zu einer Liste zulassiger Konfigurationsdatensatze, 3) eine Refe- 
renz zu einem Konfigurationsdatensatz, welcher der aktuell in Betracht gezogenen ISA entspricht, d. h. eine Referenz zu 35 
dem Konfiguration-Datensatz, welcher die aktuelle DRPU-Konfiguration definiert, 4) eine Verbindungs-Adressenliste, 
welche eine oder mehrere Verbindungs-Ein/Ausgabeeinheiten 3304 in der T-Einrichtung 3014 identifiziert, welche der 
S-Einrichtung 3012 zugeordnet ist, in welcher die IF-Einheit 3060 untergebracht ist, wie im einzelnen unten in Verbin- 
dung mit Fig. 21 noch beschrieben wird, 5) einen Satz Unterbrechungsansprechsignale, welche eine Unterbrechungsla- 
tenz und Unterbrechungsprazisions-Information spezifizieren, welche definiert, wie die IF-Einheit 3060 auf Unterbre- 40 
chungen antwortet, und 6) eine Speicherzugriffskonstante, welche ein Speicheradressen-Inkrement definiert. 

In der bevorzugten Ausfuhrungsform implementiert jeder Konfigurations-Datensatz den Architektur-Beschreibungs- 
speicher 3101 als einen Satz von CL-B16cken, die als ein Festwertspeicher (ROM) konfiguriert sind. Die Architektur- 
Spezifikationssignale, welche den Inhalt des Architekturbeschreibungsspeichers 3101 definieren, sind vorzugsweise in 
jedem Konfigurations-Datensatz enthalten. Folglich andert sich, da jeder Konfigurations-Datensatz einer ganz bestimm- 45 
ten ISA entspricht, der Inhalt des Architektur-Beschreibungsspeichers 3103 entsprechend der aktuellen in Betracht ge- 
zogenen ISA. Fur eine vorgegebene ISA wird ein Prograrnmzugriff auf den Inhalt des Architektur-Beschreibungsspei- 
chers 3101 vorzugsweise durch das Einbeziehen eines Speicherlesebefehls in dem ISA erleichtert. Dies ermoglicht ei- 
nem Programm, die Information iiber die aktuelle DRPU-Konfigurauon wahrend einer Programmdurchfiihrung wieder 
aufzufinden. 50 

In der vorliegenden Erfindung ist die Konfigurationslogik 3104 eine Zustandseinrichtung, welche eine Folge von Re- 
konfigurationsoperationen steuert, welche eine Rekonfiguration der DRP-Einheit 3032 entsprechend einem Konfigurati- 
onsdatensatz erleichtem. Vorzugsweise initiiert die Rekonfigurationslogik 3104 die Rekonfigurauonsoperationen bei 
Empfang eines Rekonfigurationssignals. Wie unten noch im einzelnen beschrieben wird, wird das Rekonfigurationssi- 
gnal von der Unterbrechungslogik 3106 entsprechend einer Rekonfigurationsunterbrechung, die auf der extemen Steu- 55 
erleitung 3048 erhalten worden ist, oder durch die ISS 3100 entsprechend einer Rekonfigurationsanweisung erzeugt, die 
in ein Programm eingebettet ist. Die Rekonfigurauonsoperationen sorgen fur eine anfangliche DRPU-Konfiguration, auf 
die eine Energieeinschalt/Riicksetzbedingung mit Hilfe des vorgegebenen Konfigurationsdatensatzes von dem Architek- 
tur-Beschreibungsspeicher 3101 folgt. Die Rekonfigurauonsoperationen sorgen auch fur eine selektive DRPU-Rekonfi- 
guration, nachdem die anfangliche DRPU-Konfiguration eingerichtet worden ist. Bei Beendigung der Rekonfigurations- 60 
operationen gibt die Rekonfigurationslogik 3104 ein Beendigungssignal ab. In der bevorzugten Ausfuhrungsform ist die 
Rekonfigurationslogik 3104 eine nichtrekonfigurierbare Logik, welche das Laden von Konfigurationsdatensatze in die 
umprograrnrnierbare Logikvorrichtung selbst steuert, und folglich ist die Folge von Rekonfigurauonsoperationen von 
dem Hersteller der umprogrammierbaren Logikvorrichtung festgelegt. Die Rekonfigurauonsoperationen sind daher dem 
Fachmann bekannt. 65 

Jede DRPU-Konfiguration ist vorzugsweise durch einen Konfigurations-Datensatz gegeben, welcher eine ganz be- 
stimmte Hardware-Organisation fesdegt, die der Ausfuhrung einer entsprechenden ISA zugeeignet ist. In der bevorzug- 
ten Ausfuhrungsform enthalt die IF-Einheit 3060 jeweils die vorstehend angegebenen Elemente unabhangig von der 
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DRPU-Konfiguration. Bei einem Grundpegel ist die Funktionalitat, die durch jedes Element in der EF-Einheit 3060 ge- 
schaffen ist, unabhangig von der aktuell in Betracht gezogenen ISA. Jedoch konnen sich in der bevorzugten Ausfiih- 
rungsform der detaillierte Aufbau und die Funktionalitat eines oder mehrerer Elemente der IF-Einheit3060 basierend auf 
der BeschafFenheit der ISA andern, fiir welche sie konfiguriert worden ist. In der bevorzugten Ausfiihrungsform bleiben 
5 der Aufbau und die Funktionalitat des Architektur-Beschreibungsspeichers 3101 und der Rekonfigurationslogik 3104 
vorzugsweise von einer DRPU-Konfiguration zur anderen konstant. Der Aufbau und die Funktionalitat der anderen Ele- 
mente der IF-Einheit 3060 und der Art und Weise, in welcher sie sich entsprechend dem ISA-T^p andern, wird nunmehr 
im einzelnen beschrieben. 

Der ProzeBsteuerregister-(PCR-)Satz 3122 speichert Signale und Daten, die von dem ISS 3100 wahrend einer Be- 
lt) fehlsausfuhrung venvendet worden sind. In der bevorzugten Ausfuhrungsform weist der PCR-Satz3122 ein Register 
zum Speichern eines ProzeBsteuerwarts, ein Register zum Speichern eines Unterbrechungsvektors und ein Register zum 
Speicher einer Referenz zu einem Konfigurationsdatensatz auf. Das ProzeBsteuerwort enthalt vorzugsweise eine Anzahl 
von Bedingungsflags, die selektiv basierend auf Bedingungen gesetzt und riickgesetzt werden konnen, die wahrend einer 
Befehlsausfuhrung auftreten. Das ProzeBsteuerwort enthalt zusatzlich eine Anzahl von Ubergangssteuersignalen, die ein 
15 oder mehrere Arten festlegen, auf welchen Unterbrechungen verwaltet werden konnen, wie im einzelnen unten noch be- 
schrieben wird. In der bevorzugten Ausfuhrungsform ist der PCR-Satz 3122 als ein Satz von LC-B16cken ausgefuhrt, die 
fiir eine Datenspeicher- und Ansteuerlogik konfiguriert sind. 

ISS 3100 ist vorzugsweise eine Zustandseinrichtung, welche die Operation der Abrufsteuereinheit 3108, der Deco- 
diersteuereinheit 3112, der DO-Einheit 3062 und der AO-Einheit 3064 steuert und Speicherlese- und -Schreibsignale an 
20 die Speicheradressenlogik 3102 abgibt, um eine Befehlsausfuhrung zu erleichtern. In Fig. 14 ist ein Zustandsdiagramm 
dargestellt, das eine bevorzugte Menge von Zustanden zeigt, die von der ISS 3100 gestiitzt sind. Im AnschluB an eine 
Energieeinschalt- oder Riicksetzbedingung oder unmittelbar nachdem eine Rekonfiguration aufgetreten ist, beginnt die 
ISS 3100 eine Operation im Zu stand P. Entsprechend dem Beendigungssignal, das von der Rekonfigurationslogik 3104 
abgegeben worden ist, geht die ISST- 3100 auf den Zustand S iiber, in welchem der ISS Programmzustandsinformation 
25 fiir den Fall initialisiert oder wieder speichert, daB eine Energieeinschalt-/Riicksetzbedingung oder eine Rekonfiguration 
aufgetreten ist. 

Die ISS 3100 riickt als nachstes auf einen Zustand F vor, in welchem Befehlsabruf-Operationen durchgefuhrt werden. 
Bei den Befehlsabrufoperationen gibt ISS 3100 ein Speicherlesesignal an die SpeicherzugrifBogik 3102 ab, gibt ein Ab- 
ruf signal an die Abrufsteuereinheit 3108 und ein Inkrementsignal an die AO-Einheit 3064 ab, um ein nachstes Befehls- 

30 progranmadressen-(NIPA-)Register 3232 zu inkrementieren, wie im einzelnen unter Bezugnahme auf Fig. 19A und 19B 
nachstehend noch beschrieben wird. Nach dem Zustand F geht ISS 3100 auf einen Zustand D vor, um Befehl sdecodier- 
operationen zu initiieren. Im Zustand D gibt ISS 3100 ein Decodiersignal an die Decodiersteuerlogik 3112 ab, wahrend 
beim Zustand D ISS 3100 zusatzlich einen Operationscode wiederfindet, der einem decodierten Befehl von dem Opera- 
tionscode-Speicherregistersatz 3116 entspricht. 

35 Basierend auf dem wiedergefundenen von dem Operationscode geht ISS 3100 auf einen -Zustand E oder M iiber, um 
Befehlsausfiihrungsoperationen durchzufuhren. ISS 3100 geht auf den Zustand E in dem Fall vor, daB der Befehl in ei- 
nem einzigen Taktzyklus ausgeflihrt werden kann; anderenfalls geht ISS 3100 auf den Zustand M fur eine in Mehrzyklen 
durchzufiihrende Befehlsausfuhrung vor. Bei den Befehlsausfiihrungsoperationen erzeugt ISS 3100 DOU und AOU- 
Steuersignale und/oder Signale, die auf die Speicherzugriffslogik 3102 gerichtet sind, um die Ausfuhrung des Befehls zu 

40 erleichtern, der dem wiederaufgefundenen Operationscode entspricht Im AnschluB entweder an den Zustand E oder M 
geht ISS 3100 auf einen Zustand W iiber. 

Im Zustand W erzeugt ISS 3100 DOU-, AOU-Steuersignale und/oder Speicherschreibsignale, um ein Speichern eines 
Befehlsausfuhrungsergebnisses zu erleichtern. Der Zustand W wird daher als ein Ruckschreibzustand bezeichnet. Der 
Fachmann weiB, daB die Zustande F, D, E oder M und W einen vollstandigen Befehlsausfiihrungszyklus aufweisen. Nach 

45 dem Zustand W geht die ISS 3100 auf den Zustand Y in dem Fall iiber, daB eine Suspension einer Befehlsausfuhrung ge- 
fordert wird. Der Zustand Y entspricht einem Freizustand, welcher gefordert werden kann, beispielsweise in dem Fall, 
daB eine T-Einrichtung 3014 Zugriff auf den Speicher 3034 der S-Einrichtung fordert. Nach dem Zustand Y oder W geht 
in dem Fall, daB eine Befehlsausfuhrung fortzusetzen ist, die ISS 3100 auf den Zustand F zuriick, um wieder einen an- 
deren Befehlsausfiihrungszyklus aufzunehmen. 

50 Wie in Fig, 14 dargestellt, weist das Zustandsdiagramm auch einen Zustand I auf, welcher als ein Unterbrechungsser- 
vice- Zustand definiert ist. Bei der Erfindung empfangt ISS 3100 Unterbrechungsankiindigungssignale von der Unterbre- 
chungslogik 3106. Wie im einzelnen unter Bezugnahme auf Fig. 15 auch beschrieben wird, erzeugt die Unterbrechungs- 
logik 3106 Ubergangssteuersignale und speichert diese Signale in dem ProzeBsteuerwort in dem PCR-Satz 3122. Die 
Ubergangssteuersignale zeigen vorzugsweise an, welcher der Zustande F, D, E, M, W und Y unterbrechbar sind und zei- 

55 gen einen Pegel einer Unterbrechungsprazision, die in jedem unterbrechbaren Zustand erforderlich ist, und fur jeden un- 
terbrechbaren Zustand einen nachsten Zustand an, bei welchem eine Befehlsdurchfuhrung im AnschluB an den Zustand I 
fortzusetzen ist. Wenn ISS 3100 ein Unterbrechungsankiindigungssignal erhalt, wahrend es sich in einem vorgegebenen 
Zustand befindet, geht ISS 3100 auf den Zustand I iiber, wenn die Ubergangssteuersignale anzeigen, daB der aktuelle Zu- 
stand unterbrechbar ist. Andemfalls geht ISS 3100 weiter, wenn kein Unterbrechungssignal empfangen worden ist, bis 

60 ein unterbrechbarer Zustand erreicht wird. 

Sobald ISS 3100 auf den Zustand I vorgeriickt ist, greift ISS 3100 vorzugsweise auf den PCR-Satz 3122 zu, um ein 
Unterbrechungsabdeckfiag zu setzen und einen Unterbrechungsvektor wieder aufzufinden. Nach dem Wlederauffinden 
des Unterbrechungsvektors verwaltet ISS 3100 vorzugsweise die aktuelle Unterbrechung iiber einen herkomrnlichen 
Subroutine-Sprung zu einem Unterbrechungshandhabungsprogramm, wie es durch den Unterbrechungsvektor spezifi- 

65 ziert ist. 

In der Erfindung wird eine Rekonfiguration der DRPU-Einheit 3032 entsprechend 1 ) einer Rekonfigurationsunterbre- 
chung, die auf der extemen Steuerleitung 3048 durchgesetzt oder 2) die Durchfuhrung einer Rekonfigurationsanweisung 
in einer Folge von Programmbefehlen initiiert. In der bevorzugten Ausfuhrungsform fuhren sowohl die Konfigurations- 
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unterbrechung als auch die Durchfuhrung einer Rekonfigurationsanweisung zu einem Subroutine-Sprung auf ein Rekon- 
figuradons-Handhabungsprogramrn. Vorzugsweise stellt das Rekonfigurations-Handhabungsprogramm eine Programm- 
zustandsinformation sicher und gibt eine Konfigurationsdatensatz-Adresse und das Rekonflgurationssignal an die Re- 
konfiguradonslogik 3104 ab. 

Fur den Fall, daB die aktuelle Unterbrechung nicht eine Rekonfigurationsunterbrechung ist, geht ISS 3100 auf einen 5 
nachsten Zustand uber, was durch die tjbergangssteuersignale angezeigt ist, sobald die Unterbrechung verwaltet worden 
ist um dadurch einen Befehlsdurchfuhrungszyklus wieder aufzunehmen, Befehle durchzufuhren oder zu initiieren. 

In der bevorzugten Ausfiihrungsform andert sich die Menge an Zustanden, welche durch ISS 3100 gestiitzt sind, eni- 
sprechend der BeschafFenheit der ISA, fur welche die DRP-Einheit 3032 konfiguriert worden ist. Folglich ist der Zustand 
M fur eine ISA nicht vorhanden, in welcher ein oder mehrere Befehle in einem einzigen Taktzyklus durchgefiihrt werden 10 
konnen, wie es der Fall bei einer typischen Innenschleifen-IS-Architektur ist. Wie beschrieben, definiert das Zustands- 
diagramm der Fig. 14 vorzugsweise die Zustande, die von ISS 3100 gestutzt worden sind, um eine generelle AuBen- 
schleifen-IS-Architektur durchzufuhren. Fiir das Durchfiihren einer Innenschleif en-ISA tragt ISS 3100 vorzugsweise 
mehrere Satze von Zustanden F, D, E und W parallel nebeneinander, um dadurch eine Pipeline-Steuerung einer Befehls- 
durchfuhrung in einer Weise zu erleichtem, die dem Fachmann ohne weiteres verstandlich ist. In der bevorzugten Aus- 15 
fuhrungsform ist ISS 3100 als eine auf einem CL-Block basierende Zustandseinrichtung ausgefuhrt, welche die Zustande 
oder eine Untergruppe der vorstehend beschriebenen Zustande entsprechend einem aktuell in Betracht gezogenen ISA 
unterstiitzt. 

Die Unterbrechungslogik 3106 weist vorzugsweise eine Zustandseinrichtung auf, welche Ubergangssteuersignale er- 
zeugt und Unterbrechungshinweis-Operationen entsprechend einem Unterbrechungssignal durchfuhrt, das uber die ex- 20 
terne Steuerleitung 3048 erhalten worden ist. In Fig, 15 ist ein Zustandsdiagramm dargestellt, das einen bevorzugten Satz 
Zustande zeigt, die von der Unterbrechungslogik 3106 gestutzt sind. Die Unterbrechungslogik 3106 beginnt eine Opera- 
tion im Zustand R Der Zustand P entspricht einer Energieeinschalt-Rucksetz- oder Rekonfigurationsbedingung. Entspre- 
chend dem Beendigungssignal, das von der Rekonfigurationsiogik 3104 abgegeben worden ist, geht die Unterbrechungs- 
logik 3106 auf den Zustand A uber und findet die Unterbrechungsantwortsignale aus dem Architekturbeschreibungsspei- 25 
cher 3101 wieder. Die Unterbrechungslogik 3106 erzeugt dann die Obergangssteuersignale aus den Unterbrechungsant- 
wortsignalen und speichert die Ubergangssteuersignale in dem Proze8steuerregister-(PCR-)Satz 3122. In der bevorzug- 
ten Ausfiihrungsform enthalt die Unterbrechungslogik 3106 eine auf CLB basierende programmierbare Logikanordnung 
(PLA), um die Unterbrechungsantwortsignale zu empfangen und um die Ubergangssteuersignale zu erzeugen. Im An- 
schluB an den Zustand A geht die Unterbrechungslogik 3106 auf den Zustand B uber, um auf ein Unterbrechungssignal 30 
zu warten. Bei Empfang eines Unterbrechungssignals geht die Unterbrechungslogik 3106 auf einen Zustand C in dem 
Fall uber, daB das Unterbrechungsabdeckflag in dem PCR-Satz 3122 riickgesetzt wird. Sobald sie im Zustand C ist, be- 
sdmmt die Unterbrechungslogik 3106 den Ursprung der Unterbrechung, eine Unterbrechungsprioritat und die Unterbre- 
chungs-Handhabungsadresse. In dem Fall, daB das Unterbrechungssignal eine Rekonfigurationsunterbrechung ist, geht 
die Unterbrechungslogik 3106 auf einen Zustand R iiber, und speichert eine Konfigurationsdatensatz-Adresse in dem 35 
PCR-Satz 3122. Nach dem Zustand R oder im AnschluB an den Zustand G fiir den Fall, daB das Unterbrechungssignal 
keine Rekonfigurations-Unterbrechung ist, geht die Unterbrechungslogik 3106 auf einen Zustand N iiber und speichert 
die Unterbrechungshandhabungsadresse in dem PCR-Satz 3122. Die Logik3106 geht auf einen Zustand X uber und gibt 
ein Unterbrechungshinweissignal an ISS 3100 ab. Im AnschluB an den Zustand X kehrt die Unterbrechungslogik 3122 
auf den Zustand B zuriick, um auf ein nachstes Unterbrechungssignal zu warten. 40 

In der bevorzugten Ausfiihrungsform andert sich der Pegel einer Unterbrechungslatenz, wie sie durch die Unterbre- 
chungsantwortsignale und folglich durch die Obergangssteuersignale speziflziert ist, entsprechend einer aktuellen ISA, 
fur welche die DRP-Einheit 3032 konfiguriert worden ist. Beispielsweise erfordert eine ISA, die einer Hochleistungs- 
Echtzeitbewegungssteuerung gewidmet ist, schnelle und vorhersehbare Unterbrechungsantwort-Fahigkeiten. Der Konfi- 
guradonsdatensatz, der einer solchen ISA entspricht, weist daher vorzugsweise Unterbrechungsanwortsignale auf, die 45 
anzeigen, daB eine Unterbrechung geringer Latenz erforderlich ist. Die entsprechenden Ubergangssteuersignale wie- 
derum idendfizieren vorzugsweise mehrfache ISS-Zustande als unterbrechbar, um dadurch eine Unterbrechung zuzulas- 
sen, um einen Befehlsausftihrungszyklus vor der Beendigung der Befehlsausfuhrungszyklus aufzuschieben. Im Gegen- 
satz zu einer ISA fur eine Realzeit-Bewegungssteuerung erfordert eine ISA fur Bildfaltungsoperadonen Unterbrechungs- 
antwort Moglichkeiten, die sicherstellen, daB die Anzahl Faltungsoperadonen, die pro Zeiteinheit durchgefuhrt worden 50 
sind, rnaximiert ist. Der Konfigurationsdatensatz, welcher der Bildfaltungs-ISA entspricht, weist vorzugsweise Unter- 
brechungsantwortsignale auf, die eine hochlatente Unterbrechung erforderlichenfalls spezifizieren. Die entsprechenden 
Ubergangssteuersignale idendfizieren vorzugsweise einen Zustand W, wenn er unterbrechbar ist. Fiir den Fall, daB ISS 
3100 Mehrfachsatze von Zustanden F, D, E und W in paralleler Form stutzt, wenn konfiguriert wird, um die Bildfaltungs- 
ISA durchzufuhren, idendfizieren die "Obergangssteuersignale vorzugsweise jeden Zustand W, wenn er unterbrechbar ist, 55 
und spezifizieren femer, daB eine Unterbrechungsbedienung zu verzogern ist, bis jeder der parallelen Befehlsdurchfuh- 
rungszyklen, deren den Zustand W betreffenden Operadonen beendet haben. Hierdurch ist sichergestellt, daB eine ganze 
Gruppe von Befehlen durch gefuhrt wird, bevor eine Unterbrechung vorgenommen wird, um dadurch verniinftige Pipe- 
line-Durchfuhmngs-Leistungspegel aufrechtzuerhalten. 

Analog zu dem Unterbrechungslatenz-Pegel andert sich auch der Pegel einer Unterbrechungsprazision, wie sie durch 60 
die Unterbrechungsantwortsignale speziflziert ist, entsprechend der ISA, fur welche die DRP-Einheit 3032 konfiguriert 
wird. Beispielsweise spezifizieren in dem Fall, daB der Zustand M als ein unterbrechbarer Zustand fiir eine AuBenschlei- 
f en-ISA definiert ist, welche unterbrechbare Mehrzyklen-Operadonen stutzt, vorzugsweise die Unterbrechungsantwort- 
signale, daB genau Unterbrechungen gefordert werden. Die Ubergangssteuersignale spezifizieren dann, daB Unterbre- 
chungen, die beim Zustand M erhalten worden sind, als genaue Unterbrechungen behandelt werden, um sicherzustellen, 65 
daB Mehrzyklen-Operadonen erfolglich wieder gestartet werden konnen. Bei einem anderen Beispiel spezifizieren fur 
eine ISA, welche nicht-fehlerhafte, durch eine Pipeline verbundene Rechenoperationen stutzt, die Unterbrechungsant- 
wortsignale vorzugsweise, daB nicht genaue Unterbrechungen gefordert werden. Die Ubergangssteuersignale spezifizie- 
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ren dann, daB Unterbrechungen, die beim Zustand W erhalten worden sind t als ungenaue Unterbrechungen behandelt 
werden. 

Fiir eine vorgegebene ISA werden die Unterbrechungsantwortsignale definiert oder durch einen Teil des entsprechen- 
den Konfigurationsdatensatzes einer ISA programmiert. Uber die programmierbaren Unterbrechungsantwortsignale und 
5 die Erzeugung von entsprechenden Ubergangssteuersignalen erleichtert die Erfindung, die Durchfuhrung eines optirna- 
len Unterbrechungsschemas auf einer ISA-zu-ISA-Basis. Der Fachmann weiB, daB die groBe Mehrzahl von herkommli- 
chen Computer-Architekturen nicht fiir die flexible Spezifikation von Unterbrechungsmoglichkeiten, namlich einer pro- 
grammierbaren Zustandsiibergangsfreigabe, einer programmierbaren Unterbrechungslatenz und einer programmierba- 
ren Unterbrechungsprazision vorsorgen. In der bevorzugten Ausfuhrungsform ist die Unterbrechungslogik 3106 als eine 

10 auf CLB basierende Zustandseinrichtung ausgefuhrt, welche die vorstehend beschriebenen Zustande stiitzt. 

Die Abrufsteuereinheit 3108 richtet das Laden von Befehlen in den Befehlspuffer 3110 entsprechend dem Abrufsignal 
aus, das von ISS 3100 abgegeben worden ist und in der bevorzugten Ausfuhmngsform ist die Abrufsteuereinheit 3108 
als eine herkornmliche (one-hot) codierte Zustandseinrichtung mit Flip-Flops in einer Gruppe von CL-B16cken ausge- 
fuhrt. Der Fachmann erkennt, daB in einer alternativen Ausfuhrungsform die Abrufsteuereinheit 3108 auch als eine her- 

15 kommliche codierte Zustandseinrichtung oder als eine auf ROM basierende Zustandseinrichtung konfiguriert sein 
konnte. Der Befehlsspeicher3110 schafft eine voriibergehende Speicherung fur Befehle, die aus dem Speicher 3034 ge- 
laden sind. Fiir die Durchfuhrung einer auBeren Schleifen-ISA ist der Befehlspuffer 3110 vorzugsweise als ein herkomm- 
licher, auf RAM basierender FIFO-Puffer mit einer Vielzahl von CL-B16cken ausgefuhrt. Fiir die Ausfuhrung einer In- 
nenschleifen-ISA ist der Befehlspuffer 3110 vorzugsweise als ein Satz von Flip-Flop-Registern mit einer Anzahl Rip- 

20 Flops in einer Gruppe von IOBs oder einer Vielzahl Flip-Flops sowohl in IOBs als auch CLBs ausgefuhrt 

Die Decodiersteuereinheit 3112 richtet die "Obertragung von Befehlen von dem Befehlspuffer 3110 in den Befehlsde- 
codierer 3114 entsprechend dem Decodiersignal aus, das von der ISS 3100 abgegeben worden ist. Fiir eine Innenschlei- 
fen-IS A ist die Decodiersteuereinheit 3112 vorzugsweise als eine auf ROM-basierende Zustandseinrichtung mit einem 
auf CLB basierenden ROM ausgefuhrt, der mit einem auf CLB basierenden Register verbunden ist. Fiir eine AuBen- 

25 schleifen-ISA ist die Decodiersteuereinheit 3112 als eine auf CLB basierende codierte Zustandseinrichtung ausgefuhrt. 
Fiir jeden Befehl, der als Eingangssignal empfangen wird, gibt der Befehlsdecoder 3114 einen entsprechenden Operati- 
onscode eine Register-Dateiadresse und wahlweise ein- oder mehrere Konstanten in herkomrnlicher Weise ab. Fiir eine 
Innenschleifen-ISA ist der Befehlsdecodierer 3115 vorzugsweise entsprechend konfiguriert, um eine Gruppe von Befeh- 
len, die als Eingangssignal empfangen worden sind, zu decodieren. In der bevorzugten Ausfuhrungsform wird der Be- 

30 fehlsdecodierer 3114 als ein auf CLB-basierender Decodierer ausgefuhrt, der entsprechend konfiguriert ist, um jeden der 
Befehle, die in der aktuellen in Betracht gezogenen ISA enthalten sind, zu decodieren. 

Der Operationscode-Speicheuegister-(OSR-)Satz3113 schafft eine voriibergehende Speicherung fur jeden Operation- 
scodeausgang durch den Befehlsdecodierer 3144 und gibt jeden Operationscode an ISS 3100 ab. Wenn eine AuBen- 
schleifen-ISA in der DRP-Einheit 3032 durchgefuhrt wird, wird der OSR-Satz 3113 vorzugsweise mit Hilfe einer opti- 

35 malen Anzahl von Rip-Rop-Registerbanken ausgefuhrt. Die Flip-Rop-Registerbanke erhalten Signale von dem Be- 
fehlsdecodierer 3114, welche Klassen- oder Gruppencodes darstellen, die von Operationscode-Literal-Bitfeldem aus Be- 
fehlen abgeleitet sind, die vorher den Befehlspuffer 3110 in Form einer Warteschlange durchiaufen haben. Die Flip-Rop- 
Registerbanke speichem die vorerwahnten Klassen- oder Gruppencodes gernaB einem Decodierschema, das vorzugs- 
weise eine ISS-Komplexitat minimiert. Im Falle einer Innenschleifen-ISA spei chert der OSR-Satz 3113 vorzugsweise 

40 Operationscode-Anzeigesignale, die unmittelbar von Operationscode-Literal-Bitfeldern abgeleitet worden sind, die von 
dem Befehlsdecodierer 3114 abgegeben worden sind. Innenschleifen-ISAs haben notwendigerweise kleinere Operation- 
scode-Literal-Bitfelder, um dadurch die Ausfuhrungsanforderungen hinsichtlich Puffem, Decodierern und einer Opera- 
tionscode- Anzeige fiir ein sequentielles Befehlszuordnen durch den Befehlspuffer 3110, den Befehlsdecodierer 3114 
bzw. den OSR-Satz 3116 zu minimieren. Fiir AuBenschleifen-IS As wird der OSR-Satz 3116 vorzugsweise als ein kleiner 

45 Verbund von Rip-Flops-Regis terbanken ausgefuhrt, die durch eine Bandbreite gekennzeichnet sind, die gleich der Ope- 
rationscode-LiteralgroBe oder einem Bruchteil derer ist. Fiir Innenschleifen-ISAs ist der Operationscode- Speicherregi- 
ster-(OSR-)Satz 3116 vorzugsweise eine kleinere und vereinheitlichte Rip-Rop-Registerbank als fur AuBenschleifen- 
IS As. Die reduzierte Flip-Rop-RegisterbankgroBe im Fall einer Innenschleife reflektiert die minimale Befehls-Zahicha- 
rakteristik von Innenschleifen-ISAs relativ zu AuBenschleifen-ISAs. 

50 Der HF-Adressenregister-Satz 3118 und der Konstanten-Registersatz 3120 schaffen eine voriibergehende Speicherung 
fiir jede RegisterDateiadresse bzw. jeden konstanten Ausgang fur den Befehlsdecodierer 3114. In der bevorzugten Aus- 
fuhrungsform sind der Operationscode-Speicherregistersatz 3116, der HF-Adressenregistersatz 3118 und der Konstan- 
ten-Registersatz 3112 jeweils als ein Satz von CL-Bldcken ausgefuhrt, die fur eine Datenspeicherung konfiguriert sind. 
Die Speicherzugriffslogik 3102 ist eine Speichersteuerschaltung, welche den Datentransfer zwischen dem Speicher 

55 3034, der DO-Einheit 3062 und der AO-Einheit 3064 entsprechend der SpeicheradressengroBe ausrichtet und synchro- 
nisiert, die in dem Architektur-Beschreibungsspeicher 3122 spezifiziert ist. Die Speicherzugriffslogik 3102 richtet aus 
und synchronisiert den Datentransfer und Befehle zwischen der S-Einrichtung 3012 und einer vorgegebenen T-Hnrich- 
tung 3014. In der bevorzugten Ausfuhrungsform stiitzt die Speicherzugriffslogik 3102 StoBbetrieb-Speicherzugriffe und 
ist vorzugsweise als eine herkornmliche RAM-Steuereinheit mit CL-B16cken ausgefuhrt. Der Fachmann erkennt, daB 

60 wahrend einer Rekonfiguration die Eingangs- und Ausgangsanschlusse der rekonfigurierbaren Logik fur drei Zustande 
ausgelegt sind, so daB Widerstandsabschlusse nicht bestehende Logikpegel definieren, und folglich nicht den Speicher 
3034 storen. In einer anderen Ausfuhrungsform konnte die Speicherzugriffslogik 3201 extern in der DRP-Einheit 3032 
ausgefuhrt sein. 

In Fig. 16 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer Datenoperations-(DO-)Einheit 3062 dar- 
65 gestellt. Die DO-Einheit 3062 fuhrt Operationen an Daten geniaB DOU-Steuersignalen, HF-Adressen und Konstanten 
durch, die von ISS 3100 erhalten worden sind. Die DO-Einheit 3062 weist einen DOU-Crossbar-Schalter 3150, eine 
Speicher/Ausrichtlogik 3152 und eine Datenoperationslogik 3154 auf. Der Crossbar-Schalter 3150, die Speicher/Aus- 
richtlogik 3152 und die Datenoperationslogik 3154 haben jeweils einen Steuereingang, der mit dem ersten Steueraus- 
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gang der IF-Einheit 3060 iiber die erste Steuerleitung 3070 verbunden ist. Der Crossbar-Schalter 3150 hat einen zweige- 
richteten Dateneingang, welcher den zweigerichteten Dateneingang der DOEinheit bildet, einen konstanten Eingang, 
der mit der dritten Steuerleitung 3074 verbunden ist, einen ersten Datenriickkopplungseingang, der mit einem Datenaus- 
gang der Datenoperationslogik 3154 iiber eine erste Datenleitung 3160 verbunden ist, einen zweiten Datenriickkopp- 
lungseingang, der mit einem Datenausgang der Speicher/Ausrichtlogik 3152 uber eine zweite Datenleitung 3164 verbun- 5 
den ist, und einen Datenausgang, der mit einem Dateneingang der Speicher/Ausrichtlogik 3152 uber eine dritte Daten- 
leitung 3162 verbunden ist. Zusatzlich zu dem Datenausgang hat die Speicher/Ausrichdogik 3154 einen Adressenein- 
gang, welcher mit der dritten Steuerleitung 3074 verbunden ist. Die Datenoperationslogik 3154 hat zusatzlich einen Da- 
teneingang, welcher mit dem Ausgang der Speicher/Ausrichtlogik iiber die zweite Datenleitung 3164 verbunden ist. 

Die Datenoperationslogik 3154 fiihrt Rechen-, Schiebe- und/oder logische Operationen an Daten, welche an deren Da- 10 
teneingang empfangeh worden sind, entsprechend den DOU-Steuersignalen durch, die an deren Steuereingang empfan- 
gen worden sind. Die Speicher/Ausrichtlogik 3152 weist Datenspeicherelemente auf, die fur eine voriibergehende Spei- 
cherung von Operanden, Konstanten und Teilergebnissen sorgen, die Datenberechnungen zugeordnet sind, und zwar un- 
ter der Anordnung von HF-Adressen und DOU-Steuersignalen, die an deren Adressen- bzw. Steuereingang empfangen 
worden sind. Der Crossbar-Schalter 3150 ist vorzugsweise ein herkommliches Crossbar-Steuemetz, welches das Laden 15 
von Daten aus dem Speicher 3034, dem Transfer von Ergebnissen, die von der Datenoperationslogik 3154 abgegeben 
worden sind, an die Speicher/Ausrichdogik 3152 oder den Speicher 3034 und das Laden von Konstanten, die von der IF- 
Einheit 3060 abgegeben worden sind, in die Speicher/Ausrichtlogik 3152 entsprechend den DOU-Steuersignalen er- 
leichtern, die an deren Steuereingang erhalten worden sind. In der bevorzugten Ausfuhrungsforrn hangt der Aufbau der 
Datenoperationslogik 3154 im einzelnen von den Operationsarten ab, die von der aktuellen in Betracht gezogenen ISA 20 
gestiitzt sind. Das heiBt, die Datenoperationslogik 154 weist eine Schaltung zum Durchfuhren der Rechen- und/oder lo- 
gischen Operationen auf, welche durch die Datenoperationsbefehle in der aktuell in Betracht gezogenen ISA spezifiziert 
sind Dementsprechend hangt auch der Aufbau der Speicher/Ausrichtlogik 3152 und des Crossbar-Schalters 3150 von 
der aktuell in Betracht gezogenen ISA ab. Der detaillierte Aufbau der Datenoperationslogik 3154, die Speicher/Ausricht- 
logik 3152 und der Crossbar-Speicher 3150 gernaB dem ISA-Typ wird nachstehend anhand der Fig. 17A bis 17B be- 25 
schrieben. 

Fur eine AuBenschleifen-ISA ist die DO-Einheit 3062 vorzugsweise entsprechend konfiguriert, um serielle Operatio- 
nen an Daten durchzufuhren. In Fig. 17A ist ein Blockdiagrarnrn einer ersten beispielhaften Ausfuhrungsforrn der DO- 
Einheit 3061 dargestellt, die fur die Ausfuhrung einer generellen AuBenschleifen-ISA konfiguriert ist. Die genereile Au- 
Benschleifen-ISA erfordert Hardware, die konfiguriert ist, um mathematische Operationen, wie Multiplikationen, Addi- 30 
tionen und Subtraktionen, Boolsche Operationen, wie UND, ODER und NOT, sowie Verschiebe- und Dreh operationen 
durchzufuhren. Folglich weist fiir die Durchfuhrung einer generellen AuBenscheifen-ISA die Datenoperationslogik 5154 
vorzugsweise eine Arithmetik-Logik-(AL-)Einheit/Schiebeeinheit 3184 mit einem ersten und zweiten Eingang, einem 
Steuereingang und einem Ausgang auf. Die Speicher/Ausrichtlogik 3152 weist vorzugsweise einen ersten RAM 3180 
und einen zweiten RAM 3182 auf, die jeweils einen Dateneingang, einen Datenausgang, einen Adressen-Auswahlein- 35 
gang und einen Freigabeeingang haben. Der DOU- Crossbar-Schalter 3150 weist vorzugsweise ein herkornmliches 
Crossbar-Schaltnetz mit sowohl zweigerichteten als auch einseitig gerichteten Crossbar- Verbindungen und mit den vor- 
stehend in Verbindung mit Fig. 16 beschriebenen Eingangen und Ausgangen auf. Der Fachmann weiB, daB eine effi- 
ziente Ausfuhrung des DOU-Crossbar-Schalters 3150 fiir ein AuBenschleifen-ISA Multiplexer, Puffer mit drei Zustan- 
den, eine auf CLB basierende Logik, eine direkte Verdrahtung oder Untergruppen der vorerwahnten Elemente enthalten 40 
kann, die in irgendeine Kombination durch eine rekonfigurierbare Verbindungseinrichtung verbunden sind. Fiir dem Au- 
Benschleifen-ISA ist der DUO-Crossbar-Schalter 3150 entsprechend ausgefuhrt, um eine serielle Datenbewegung in ei- 
ner minimal moglichen Zeit durchzufuhren, wahrend auch eine maximale Anzahl von eindeutigen Datenbewegungs- 
Crossbar- Verbindungen geschaffen wird, um verallgemeinerte AuBenschleifen-Befehlstypen zu stiitzen. 

Der Dateneingang des ersten und zweiten RAM 3180 bzw. 3182 ist mit dem Datenausgang des Schalter 3150 uber die 45 
dritte Datenleitung 3162 verbunden. Die Adressenauswahleingange der beiden RAM 3180 und 3182 sind entsprechend 
verbunden, um Registerdatei- Adressen von der IF-Einheit 3060 iiber die dritte Steuerleitung 3074 aufzunehmen. In ahn- 
licher Weise sind Freigabe-Eingange der beiden RAM 3180, 3182 entsprechend verbunden, uni DOU-Steuersignale uber 
erste Steuerleitungen 3070 zu erhalten. Die Datenausgange der beiden RAM 3180 und 3182 sind mit dem ersten und dem 
zweiten Eingang der ALU/Schiebeeinheit 3184 und auch mit dem zweiten Datenriickkopplungseingang des Schalters 50 
3150 verbunden. Der Steuereingang der ALU-Schiebeeinheit 3184 ist entsprechend geschaltet, um DOU-Steuersignale 
iiber die erste Steuerleitung 3070 aufzunehmen, und der Ausgang der ALU-/Schiebeeinheit 3184 ist mit dem ersten Da- 
tenriickkopplungseingang des Schalters 3150 verbunden. Die Verbindungen zu den restlichen Eingangen und Ausgangen 
des Crossbar-Schalters 3150 sind identisch mit denen, die in Verbindung mit Fig. 16 vorstehend beschrieben worden 
sind. 55 

Um das Ausfiihren eines Datenoperationsbefehls zu erleichtem, gibt die IF-Einheit 3060 DOU-Steuersignale, HF- 
Adressen- und Konstanten an die DO-Einheit 3061 wahrend einer der ISS-Zustande E oder M ab. Die beiden RAM 3180, 
3182 schaffen eine erste und zweite Registerdatei fur ein vorubergehendes Datenspeichern. Einzelne Adressen in den 
beiden RAM 3180, 3182 werden entsprechend den HF-Adressen ausgewahlt, die an jedem RAM-Adressenauswahlein- 
gang empfangen worden sind. Dementsprechend wird ein Laden der beiden RAM 3180, 3182 durch die DOU-Steuersi- 60 
gnale gesteuert, die der jeweilige RAM 3180, 3182 an seinem Schreib-Freigabeeingang erhalt. In der bevorzugten Aus- 
fuhrungsforrn weist zumindest ein RAM 3180, 3182 eine Durchgangsmoglichkeit auf, um den Datentransfer von dem 
DOU-Crossbar-Schalter 3150 unmittelbar in die ALU-Schiebeeinheit 3184 zu erleichtem. Die ALU/Schiebeeinheit 
8134 fiihrt arithmetische, logische oder Schiebeoperalionen bei einem ersten Operanden, der von dem ersten RAM 3180 
erhalten worden ist, und/oder bei einem zweiten Operanden, der von dem zweiten RAM 3182 erhalten worden ist, unter 65 
der Weisung der DOU-Steuersignale durch, die an deren Steuereingang erhalten worden sind. Der Crossbar-Schalter 
3150 leitet selektiv 1) Daten zwischen dem Speicher 3034 und den beiden RAM 3180, 3182, 2) Ergebnisse von der ALU/ 
Schiebeeinheit 3184 zu den beiden RAM 3180, 3182 oder dem Speicher 3034, 3) Daten, die in dem ersten oder zweiten 
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RAM 3180, 3182 gespeichert sind, zu dem Speicher 3034, und4) Konstante von der IF-Einheit3060 zu den beiden RAM 
3180 und3182. 

Wie vorstehend beschrieben, leitet fur den Fall, daB entweder der erste oder der zweite RAM 3180, 3182 eine Durch- 
gangsmoglichkeit enthalt, der Crossbar-Schalter 3150 selektiv auch Daten von dem Speicher 3034 oder von dem Aus- 

5 gang der ALU/Schiebeeinheit unmittelbar zuriick in die ALU-Schiebeeinheit 3184. Der Crossbar-Schalter 3150 fuhrt 
eine ganz bestimmte Schwenkoperation entsprechend den DOU-Steuersignalen durch, die an seinem Steuereingang 
empf angen worden sind. In einer bevorzugten Ausfuhrungsform ist die ALU/Schiebeeinheit 3184 durch Verwenden von 
logischen Funktionsgeneratoren in einer Gruppe von LC-Blocken und einer Schaltungsanordnung ausgefuhrt, die fur 
mathematische Operationen in der rekonfigurierbaren Logikvorrichtung vorgesehen ist Die beiden RAM 3180, 3182 

io sind jeweils vorzugsweise mit Hilfe der Datenspeicherschaltung ausgefuhrt, die in einer Gruppe von CL^Blocken vor- 
handen ist, und der Crossbar-Schalter 3150 ist vorzugsweise in der vorstehend beschriebenen Weise ausgefuhrt. 

In Fig. 17B ist ein Blockdiagramm einer zweiten beispielshaften Ausfuhrungsform einer DOEinheit 3063 dargestellt, 
die fur die Ausfiihrung einer Innenschleifen-ISA konfiguriert ist. Im allgemeinen stiitzt eine innere Schleifen-ISA ver- 
haltnismaBig wenig spezialisierte Operationen und wird vorzugsweise dazu verwendet, eine gemeinsame Menge von 

15 Operationen an moglichst groBen Datensatzen durchzufuhren. Eine optimale Rechenleistung fur eine Innenschleifen- 
ISA wird daher durch Hardware erzeugt, die entsprechend konfiguriert ist, um Operationen parallel durchzufuhren. Folg- 
lich sind in der zweiten beispielhaften Ausfuhrungsform der DO-Einheit 3063 die Datenoperationslogik 3154, die Spei- 
cher/ Ausrichtlogik 3152 und der DOU-Crossbar-Schalter 3150 entsprechend konfiguriert, um Pipeline-Berechnungen 
durchzufuhren. Die Datenoperationslogik 3154 weist eine Pipeline-Funktionseinheit 3194 mit einer Anzahl Eingange, 

20 einem Steuereingang und einem Ausgang auf. Die Speicher/Ausrichtlogik 3152 weist 1) eine Gruppe von herkommli- 
chen Flip-Flop-Anordnungen 3192, wobei jede Flip-Flop-Anordnung 3132 einen Dateneingang und -ausgang sowie ei- 
nen Steuereingang hat, und 2) einen Datenselektor 3190 auf, der einen Steuer- und einen Dateneingang sowie eine An- 
zahl Ausgange hat, welche der Anzahl an vorhandenen Flip-Flops-Anordnungen 3192 entsprechen, Der DOU-Crossbar- 
Schalter 3150 weist ein herkommliches Crossbar-Schaltnetz mit einseitig gerichteten Duplex-Crossbar- Verbindungen 

25 auf. 

In der zweiten beispielhaften Ausfuhrungsform der DO-Einheit 3063 enthalt der Crossbar-Schalter 3150 vorzugs- 
weise die Eingange und Ausgange, die vorher in Verbindung mit Fig. 16 beschrieben sind, mit Ausnahme des zweiten 
Datenruckkopplungseingangs. Analog zu dem AuBenschleifen-ISA-Fall kann eine effiziente Ausfuhrung des DOU- 
Crossbar-Schalters 3150 fur eine Innenschleifen-ISA multipliziert, Puffer mit drei Zustanden, eine auf CLB-basierende 
30 Logik, eine direkte Verdrahtung oder eine Untergruppe der vorerwahnten Eiemente enthalten, die in einer rekonfigurier- 
baren Weise verbunden sind. Uber eine Innenschleifen-ISA ist der Schalter 3150 entsprechend ausgefuhrt, um parallele 
Datenbewegungen in einer minimalen Zeit zu maximieren, obwohl auch eine minimale Anzahl von eindeutigen Daten- 
bewegungs-Crossbar- Verbindungen vorgesehen ist, um iiber eine Pipeline zugefuhrte Innenschleifen-ISA-Befehle zu 
stiitzen. 

35 Der Dateneingang des Datenselektors 3190 ist mit dem Datenausgang des Schalters 3150 uber die erste Datenleitung 
3162 verbunden. Der Steuereingang des Datenselektors 3190 ist entsprechend verbunden, um HF-Adressen iiber die 
dritte Steuerleitung 3074 aufzunehmen, und jeder Ausgang des Datenselektors 3190 ist mit einem entsprechenden Da- 
teneingang einer Flip-Flop-Anordnung verbunden. Der Steuereingang jeder Flip-Flop-Anordnung 3192 ist entsprechend 
geschaltet, um DOU-Steuersignale fur die erste Steuerleitung 3070 aufzunehmen, und jeder Datenausgang der Flip-Flop- 

40 Anordnung ist mit einem Eingang der Funktionseinheit 3194 verbunden. Der Steuereingang der Funktionseinheit 3194 
ist entsprechend geschaltet, um DOU-Steuersignale iiber die erste Steuerleitung 3070 zu erhalten, und der Ausgang der 
Funktionseinheit 3194 ist mit demersten Datenruckkopplungseingang des Crossbar-Schalters 3150 verbunden. Die Ver- 
bindungen der restlichen Eingange und Ausgange des Crossbar-Schalters 3150 sind identisch mit denjenigen, die vorher 
in Verbindung mit Fig. 16 beschrieben worden sind. 

45 Wahrend des Betriebs fuhrt die Funktionseinheit 3194 Pipeline-Operationen an Daten, welche an deren Dateneing an- 
gen empfangen worden sind, entsprechend den DOU-Steuersignalen durch, die an deren Steuereingang erhalten worden 
sind. Der Fachmann erkennt, daB die Funktionseinheit 3194 eine Multiplizier-Addiereinheit, eine Schweilenwert-Be- 
stimrnungseinheit, eine Bilddreheinheit, eine RandvergroBerungseinheit oder eine Funktionseinheit ist, die sich dazu eig- 
net, Pipeline-Operationen an aufgeteilten Daten durchzufuhren. Der Datenselektor 3190 leitet Daten vom Ausgang des 

50 Schalters 3150 in eine vorgegebene Flip-Hop- Anordnung 3192 entsprechend den HF-Adressen, die an seinem Steuer- 
eingang empfangen worden sind. Jede FLip-Hop- Anordnung 3192 weist vorzugsweise eine Gruppe von fortlaufend ver- 
bundenen Datenhaltegliedern auf, um Daten relativ zu dem Dateninhalt der anderen Flip-Flop-Anordnung 3 192 unter der 
Weisung derSteuersignale, die an deren Steuereingang erhalten worden sind, raumlich und voriibergehend auszurichten. 
Der Crossbar-Schalter 3150 leitet selektiv 1) Daten von dem Speicher 3034 zu dem Datenselektor 3190, 2) Ergebnisse 

55 von der Multiplizier-Addiereinheit 3194 zu dem Datenselektor 3190 oder dem Speicher 3034 und 3) Konstante von der 
EF-Einheit 3060 zu dem Datenselektor 3190. Der Fachmann erkennt, daB eine Innenschleifen-ISA eine Gruppe von "ein- 
gebauten" Konstanten haben kann. Bei der Durchfuhrung einer solchen Innenschleifen-ISA enthalt die Speicher- Aus- 
richtlogik 3154 vorzugsweise einen auf CLB basierenden ROM, welcher die "eingebauten" Konstanten enthalt, um da- 
durch die Notwendigkeit zu beseitigen, Konstante von der IF-Einheit 3060 in die Speicher/Ausrichtlogik 3152 iiber den 

60 Schalter 3150 zu leiten. In der bevorzugten Ausfuhrungsform ist die Funktionseinheit 3194 vorzugsweise unter Verwen- 
dung von logischen Funktionsgeneratoren und einer S chaining ausgefuhrt, die fur mathematische Operationen in einer 
Gruppe von CI^Blocken vorgesehen ist. Jede Flip-Flop-Anordnung 3192 ist vorzugsweise unter Verwendung von Flip- 
Flops in einer Gruppe von CL-B16cken ausgefuhrt, und der Datenselektor 3190 ist vorzugsweise unter Verwendung von 
logischen Funktionsgeneratoren und einer Datenauswahlschaltung in einer Gruppe von CL-Blocken ausgefuhrt. SchlieB- 

65 lich ist die DOU-Crossbar-Schaltung 3150 vorzugsweise in der Weise ausgefuhrt, die vorher beziiglich der Innenschlei- 
fen-ISA beschrieben ist. 

In Fig. 18 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer Adressenoperation-(AO-)Einheit 3064 
dargestellt. Die AO-Einheit 3064 fuhrt Operationen an Adressen entsprechend AOU-Steuersignalen, HF-Adressen und 
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Konstanten durch, die von der IF-Einheit 3060 erhalten worden sind. Die AOEinheit 3064 weist einen AOU-Crossbar- 
Schalter 3200, eine Speicher/Zahllogik 3202, eine Adressen-Betriebslogik 3204 und einen Adressenmuluplexer 3206 
auf. Der Schalter 3200, die Speicher-Zahllogik 3202, die Adressenbetriebslogik 3204 und der Adressenmultiplexer 3206 
haben jeweils einen Steuereingang, der mit dem zweiten Steuereingang der IF-Einheit 3060 iiber die zweite Steuerlei- 
tung 3072 verbunden ist. Der Schalter 3200 hat einen zweigerichteten Datenzugang, welcher den zweigerichteten Daten- 5 
zugang der AO-Einheit bildet, einen Adressenruckkopplungseingang, der mit einem Adressenausgang der Adressenope- 
rationslogik 3204 uber eine erste Adressenleitung 3210 verbunden ist, einen konstanten Eingang, der mit der dritten 
Steuerschaltung 3070 verbunden ist, und einen Adressenausgang, der mit einem Adresseneingang der Speicher/Zahllo- 
gik 3202 iiber eine zweite Adressenleitung 3212 verbunden ist. AuBer dem Adressen- und Steuereingang hat die Spei- 
cher/Zahllogik 3202 einen H-Adresseneingang, der mit der dritten Steuerleitung 3074 verbunden ist, und einen Adres- 10 
senausgang, der mit einem Adresseneingang der Adressenoperationslogik 3204 uber eine dritte Adressenleitung 3214 
verbunden ist. Der Adressenmultiplexer 3206 hat einen ersten Eingang, der mit der ersten Adressenleitung 3210 verbun- 
den ist, einen zweiten Eingang, der mit der dritten Adressenleitung 3214 verbunden ist, und einen Ausgang, welcher dem 
Adressenausgang der AO-Einheit 3064 bildet. 

Die Adressenoperationslogik 3204 fuhrt Rechenoperationen an Adressen, die an deren Adresseneingang erhalten wor- 15 
den sind, unter der Anweisung von AOU-Steuersignalen durch, die an deren Steuereingang erhalten worden sind. Die 
Speicher/Zahllogik 3202 sorgt fur eine voriibergehende Speicherung von Adressen und von Adressenrechenergebnissen. 
Der Crossbar-Schalter 3200 erleichtert das Laden von Adressen aus dem Speicher 3034, den Transfer von Ergebnissen, 
die von der Adressenoperationslogik 3204 abgegeben worden sind, an die Speicher/Zahllogik 3202 oder den Speicher 
3004 und das Laden von Konstanten, die von der IS-Einheit 3060 abgegeben worden sind, in die Speicher/Zahllogik 20 
3202 entsprechend den AOU-Steuersignalen, die an deren Steuereingang erhalten worden sind. Der Adressenmultiplexer 
3206 gibt selektiv eine Adresse, die von der Speicher/Zahllogik 3202 oder der Adressenoperationslogik 3200 erhalten 
worden ist, an den Adressenausgang der AO-Einheit 3064 unter der Anweisung der AOU-Steuersignale ab, die an deren 
Steuereingang empfangen worden sind. In der bevorzugten Ausfuhrungsforrn ist der detaillierte Aufbau des AOU-Cross- 
bar-Schalters 3200, der Speicher/Ausrichtlogik 3202 und der Adressenbetriebseinheit 3204 abhangig von der Art der ge- 25 
rade in Betracht gezogenen ISA, was nachstehend unter Bezugnahme auf Fig, 19A und 19B beschrieben wird. 

In Fig. 19A ist ein Blockdiagramm einer ersten beispielhaften Ausfuhrungsform der AO-Einheit 6065 dargestellt, die 
fiir die Durchfuhrung einer generellen Aufienschleifen-ISA konfiguriert ist. Eine generelle AuBenschleifen-ISA erfordert 
Hardware zum Durchfuhren von Operationen, wie einer Addition, einer Subtraktion, ein Inkrementieren und Dekremen- 
tieren bei dem Inhalt eines Programmzahlers und von Adressen, die in der Speicher/Zahllogik 3202 gespeichert sind. In 30 
der ersten beispielhaften Ausfuhrungsform der AO-Einheit 3065 weist die Adressenoperationslogik 3205 vorzugsweise 
ein das nachste Befehlsprogramm betreffendes Adressenregister (NIPAR) 3232 mit einem Eingang, einem Ausgang und 
einem Steuereingang, eine Recheneinheit 3234 mit ersten bis dritten Eingangen, einem Steuereingang und einem Aus- 
gang und einen Multiplexer 3230 mit einem ersten und einem zweiten Eingang, einem Steuereingang und einem Aus- 
gang auf. Die Steuer/Zahllogik 3202 weist vorzugsweise einen dritten RAM 3220 und einen vierten RAM 3222 auf, die 35 
jeweils einen Eingang, einen Ausgang, einen Adressenwahleingang und einen Freigabeeingang haben. Der Adressen- 
multiplexer 3206 weist vorzugsweise einen Multiplexer mit einem ersten, zweiten und dritten Eingang, einen Steuerein- 
gang und einem Ausgang auf. Der Crossbar-Schalter 3200 weist vorzugsweise einen herkomrnliches Crossbar-Schalt- 
netz mit einseitig gerichteten Duplex-Crossbar- Verbindungen und mit den Eingangen und Ausgangen auf, die vorher un- 
ter Bezugnahme auf Fig. 19 beschrieben worden sind. Eine effektive Ausfuhrung des AOU-Crossbar-Schalters 3200 40 
kann Multiplexer, Puffer mit drei Zustanden, eine auf CLB-basierende Logik, eine direkte Verdrahtung und eine Unter- 
gruppe solcher Elemente aufweisen, die durch rekonfigurierbare Verbindungen verbunden sind. Fur eine AuBenschlei- 
fen-ISA ist der Crossbar-Schalter 3200 vorzugsweise ausgefiihrt, um eine serielle Adressenbewegung in einer minimalen 
Zeit zu maximieren, wahrend auch eine maximale Anzahl eindeutiger Adressenbewegungs-Crossbar- Verbindungen vor- 
gesehen ist, um verallgemeinerte eine Aufienschleifen-ISA betreffende Pressenoperationsbefehle zu stiitzen. 45 

Der Eingang des dritten und vierten RAM 3220, 3222 ist jeweils mit dem Ausgang des Crossbar-Schalters 3200 uber 
die zweite Adressenleitung 3212 verbunden. Die Adressen wahleingange der dritten und vierten RAM 3220, 3222 sind 
entsprechend geschaltet, um HF- Adressen von der IF-Einheit 3060 iiber die dritte Steuerleitung 74 aufzunehmen und die 
Freigabeeinange der ersten und zweiten RAM 3220, 3222 sind entsprechend geschaltet,um AOU-Steuersignale iiber die 
zweite Steuerleitung 3072 aufzunehmen. Der Ausgang des dritten RAM 3220 ist verbunden mit dem ersten Eingang des 50 
Multiplexers 3230, mit dem ersten Eingang der Recheneinheit 3234 und dem ersten Eingang des Adressenmultiplexers 
3206. In ahnlicher Weise ist der Ausgang des vierten RAM 3222 verbunden mit dem zweiten Eingang des Multiplexers 
3220, dem zweiten Eingang der Recheneinheit 3234 und dem zweiten Eingang des Adressenmultiplexers 3206. Die 
Steuereingange des Multiplexers 3230, des NIPAR-Registers 3232 und die Recheneinheit 3234 sind jeweils mit der 
zweiten Steuerleitung 3272 verbunden. Der Ausgang der Recheneinheit 3234 bildet den Ausgang der Adressenoperati- 55 
onslogik 3204 und ist folglich mit dem Adressenruckkopplungseingang des AOU-Crossbar-Schalters 3200 und dem drit- 
ten Eingang des Adressenmultiplexers 3206 verbunden. Die Verbindungen zu den restlichen Eingangen und Ausgangen 
des AOU-Crossbar-Schalters 3200 und des Adressenmultiplexers 3206 sind identisch mit denjenigen, die vorher unter 
Bezugnahme auf Fig. 18 beschrieben worden sind. 

Um die Durchfuhrung eines Adressen-Operationsbefehls zu vereinfachen, gibt die IF-Einheit 3060 AOU-Steuersi- 60 
gnale, HF-Adressen und Konstanten an die AO-Einheit 3064 wahrend entweder des ISS-Zustandes E oder M ab. Die 
dritten und vierten RAM 3220, 3222 schaffen eine erste bzw. zweite Registerdatei fiir ein voriibergehendes Adressen- 
speichern. Einzelne Speicherstellen in dem dritten und vierten RAM 3220, 3222 werden entsprechend dem HF-Adressen 
ausgewahlt, die an jedem RAM- Adressen auswahleingang erhalten worden sind. Das Laden des dritten und vierten RAM 
3220, 3222 wird durch die AOU-Steuersignale gesteuert, die der jeweilige RAM 3220, 3222 an seinem Schreib-Freiga- 65 
beeingang erhalt. Der Multiplexer 3230 leitet selekuv Adressen, die von dem dritten und vierten RAM 3220, 3222 abge- 
geben worden sind, zu dem NIPAR-Register 3232 unter der Anweisung der AOU-Steuersignale, die an dessen Steuer- 
eingang erhalten worden sind. Das NIPAR-Register 3232 ladt eine Adresse, die von dem Ausgang des Multiplexers 3230 
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erhalten worden ist, und inkremenuert deren Inhalt entsprechend den AOU-Steuersignalen, die an dessen Steuereingang 
erhalten worden sind. 

In derbevorzugten Ausfuhrungsform speichert das NIPAR-Register 3232 die Adresse des nachsten durchzufuhrenden 
Programmbefehls. Die Recheneinheit 3234 fiihrt Rechenoperationen einschliefilich einer Addition, einer Subtraktion, ei- 

5 nes Inkrementierens und Dekrementierens an Adressen, die von dem dritten und vierten RAM 3220, 3222 und/oder an 
Inhalten eines NIPAR-Registers 3232 durch. Der Schalter 3200 leitet selektiv 1) Adressen von dem Speicher 3034 zu 
dem dritten und vierten RAM 3220, 3222 und 2) Ergebnisse von Adressenrechnungen, die von der Recheneinheit 3234 
abgegeben worden sind, zu dem Speicher 3034 oder dem dritten und vierten RAM 3220, 3222. Der AOU-Crossbar- 
Schalter 3200 fiihrt eine ganz bestimmte Lenkoperation gernaB dem AOU-Steuersignalen durch, die an dessen Steuer- 

10 eingang erhalten worden sind. Der Adressenmultiplexer 3206 lenkt selektiv Adressen, die von dem dritten RAM 3220 
abgegeben worden sind, Adressen, die von dem vierten RAM 3222 abgegeben worden sind, oder Ergebnisse von Adres- 
senrechnungen, die von der Recheneinheit 3234 abgegeben worden sind, zu dem AOU-Adressenausgang unter der An- 
weisung der AOU-Steuersignale, die an dessen Steuereingang erhalten worden sind. 

In der bevorzugten Ausfuhrungsform sind der dritte und vierte RAM 3220, 3222 jeweils durch Verwenden der Daten- 

1 5 speicherschaltung ausgefuhrt, die in einem Satz von CL-Blocken vorhanden ist. Der Multiplexer 3230 und der Adressen- 
multiplexer 3206 sind jeweils durch Verwenden einer Datenauswahlschaltung ausgefuhrt, die in einem Satz von CL- 
Blocken vorhanden ist, und das NIPAR-Register 3232 ist vorzugsweise durch Verwenden einer Datenspeicherschaltung 
ausgefuhrt, die in einem Satz CL-Blocken vorhanden ist. Die Recheneinheit 3234 ist vorzugsweise mit Hilfe von logi- 
schen Funktionsgeneratoren und einer Schaltung ausgefuhrt, die mathematischen Funktionen in einer Gruppe von CL- 

20 Blocken zugeordnet ist SchlieBlich ist der AOU-Crossbar-Schalter vorzugsweise in der vorstehend beschriebenen Weise 
ausgefuhrt. 

In Fig. 19B ist ein Blockdiagramm einer zweiten beispielhaften Ausfuhrungsform der AO-Einheit 3066 dargestellt, 
die fur die Durchfuhrung einer Innenschleifen-ISA konfiguriert ist. Vorzugsweise erfordert eine Innenschleifen-ISA 
Hardware zum Durchfuhren einer sehr begrenzten Menge von Adressenoperationen, und eine Hardware, urn zumindest 

25 einen Quellenadressenzeiger und eine entsprechende Anzahl von Bestimmungsadressenzeigern aufrechtzuerhalten. Eine 
Innenschleifen-Verarbeitung, fiir welche eine sehr begrenzte Anzahl von Adressenoperationen oder sogar eine einzige 
Adressenoperation erforderlich sind, enthalt Block- oder Serpentinenoperationen an Bilddaten, Bitumkehroperationen, 
Operationen an zirkularen Pufferdaten und Parsing-Operationen an Daten variabler Lange. 

Nachstehend wird eine einzige Adressenoperation betrachtet, namlich eine Inkrement-Operation. Der Fachmann er- 

30 kennt, daB Hardware, welche Inkrement-Operationen durchfiihrt, auch inharent in der Lage ist, Dekrementier-Operatio- 
nen durchzufuhren, um dadurch eine zusatzliche Adressen-Operationsmoglichkeit zu schafFen. In der zweiten beispiel- 
haften Ausfuhrungsform der AO-Einheit 3076 weist die Speicher/Zahllogik 3202 zumindest auf ein Quellenadressenre- 
gister 3252 mit einem Eingang, einem Ausgang und einem Steuereingang, zumindest ein Bestimmungsadressenregister 
3254 rnit einem Eingang, einem Ausgang und einem Steuereingang und einen Datenselektor 3250 mit einem Eingang, 

35 einem Steuereingang und einer Anzahl Ausgange, welche gleich der Gesamtanzahl an vorhandenen Quellen-Bestirn- 
mungs-Adressenregister 3252, 3254 ist Hier werden ein einziges Quellenadressenregister 3252 und ein einziges Bestim- 
mungsregister 3254 betrachtet und daher hat der Datenselektor 3250 einen ersten und einen zweiten Ausgang. 

Die Adressenoperations-Logik 3204 weist ein NIPAR-Register 3232 mit einem Eingang, einem Ausgang und einem 
Steuerausgang, wie einen Multiplexer 3260 auf, der eine Anzahl Eingange, die gleich der Anzahl Datenselektorausgange 

40 sind, einen Steuereingang und einen Ausgang hat. Hierbei hat der Multiplexer 3260 einen ersten Eingang und einen 
zweiten Eingang. Der Adressenmultiplexer 3206 weist vorzugsweise einen Multiplexer mit einer Anzahl Eingange auf, 
welche um eins grbBer ist als die Anzahl an Datenselektorausgangen, einem Steuereingang und einem Ausgang auf. 
Folglich hat hier der Adressenmultiplexer 3201 einen ersten, einen zweiten und einen dritten Eingang. Der Crossbar- 
Schalter 3200 weist vorzugsweise ein herkornmliches Crossbar-Schaltnetz mit zweiseitig und einseitig gerichteten 

45 Crossbar- Verbindungen und mit den Eingangen und Ausgangen, die vorher in Verbindung mit Fig. 18 beschrieben wor- 
den sind. Eine effiziente Ausfuhrung des AOU-Crossbar-Schalters 3200 kann enthalten Multiplexer, Puffer mit drei Zu- 
standen, eine auf CLB basierende Logik, eine Direktverdrahtung oder eine Untergruppe solcher Elemente, die durch re- 
konfigurierbare Kopplungen verbunden sind. Fiir eine Innenschleifen-ISA ist der Schalter 3200 vorzugsweise ausgelegt, 
um eine parallele Adressenbewegung in einer minimal moglichen Zeit durchzufuhren, wahrend auch eine minimale An- 

50 zahl von eindeutigen Adressenbewegungs-Crossbar-Kopplungen vorgesehen sind, um Innenschleifen-Operationen zu 
stiitzen. Der Eingang des Daten selektors 3250 ist mit dem Ausgang des Schalters 3200 verbunden. Die ersten und zwei- 
ten Ausgange des Datenselektors 3250 sind mit dem Eingang des Feldadressenregister 3252 bzw. des Bestimmungs- 
adressen-Registers 3254 verbunden. Die Steuereingange des Quellenadressenregisters 3252 und des Bestimmungsadres- 
senregister 3254 erhalten AO-Steuersignale iiber die zweite Steuerleitung 3072. Der Ausgang des Quellenadressenregi- 

55 sters 3252 ist mit dem ersten Eingang des Multiplexers 3260 und dem ersten Eingang des Adressenmultiplexers 3206 
verbunden. Dementsprechend ist der Ausgang des Bestirnmungsregisters 3254 mit dem zweiten Eingang des Multiple- 
xers 3260 bzw. des Adressenmultiplexers 3206 verbunden. Der Eingang des NIPAR-Registers 3232 ist mit dem Ausgang 
des Multiplexers 3260 verbunden. Der Steuereingang des Registers 3232 erhalt AOU-Steuersignale iiber die zweite 
Steuerleitung 3072, und der Ausgang des Registers 3232 ist sowohl mit dem Adressenriickkopplungseingang des Schal- 

60 ters 3200 als auch mit dem dritten Eingang des Adressenmultiplexers 3206 verbunden. Die Verbindungen zu den restli- 
chen Eingangen und Ausgangen des Schalters 3200 sind identisch rnit dem, die vorher beziiglich Fig. 18 beschrieben 
worden sind. 

Beim Betrieb leitet der Datenselektor 3250 Adressen, die von dem AOU-Crossbar-Schalter 3200 erhalten worden 
sind, zu dem Quellenadressenregister 3252 oder dem Bestimmungsadressenregister 3254 entsprechend den HF-Adres- 
65 sen, die an dem Steuereingang erhalten worden sind. Das QueUenadressenregister3252 ladt eine an dessen Eingang vor- 
handene Adresse entsprechend den an dessen Steuereingang vorhandenen AOU-Steuersignale. Das Bestimmungsadres- 
senregister 3254 ladt eine an dessen Eingang vorhandene Adresse in analoger Weise. Der Multiplexer 3260 leitet eine 
Adresse, die er von dem Quellenadressenregister 3252 oder dem Bestimmungsadressenregister 3254 erhalten hat, zu 
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dem Eingang des NEPAR-Registers 3232 entsprechend der AOU-Steuersignalen, die er an dem Steuereingang erhalten 
hat. Das Register 3232 ladt eine an dessen Eingang vorhandene Adresse, inkrementiert oder dekrementien dessen Inhalt 
entsprechend den an dem Steuereingang erhaltenen AOU-Steuersignalen. Der AOU-Crossbar-Schalter 3200 lenkt selek- 
tiv 1) Adressen von dem Speicher 3034 zu dem Datenselektor 3050 und 2) den Inhalt des Registers 3232 zu dem Spei- 
cher 3034 oder dem Datenselektor 3250. Der AOU-Crossbar-Schalter 3200 fuhrt eine ganz bestirnmte Leitoperation ent- 5 
sprechend den an dem Steuereingang erhaltenen AOU-Steuersignalen. Der Adressenmultiplexer 3206 leitet selektiv den 
Inhalt des Quellenadressenregisters 3252, des Bestimmungs adressen registers 3254 oder des NEPAR-Registers 3232 zu 
dem AOU- Adressen ausgang unter der Anweisung der an dessen Steuereingang erhaltenen AOU-Steuersignalen. 

In der bevorzugten Ausfuhrungsform sind das Quellenadressenregister 3252 und das Bestimmungsadressenregister 
3254 jeweils unter Verwendung der Datenspeicherschaltung ausgefiihrt, die in einem Satz von CL-Bldcken vorhanden 10 
ist Das NIPAR-Register 3232 ist vorzugsweise mit Hilfe einer Inkrementier/Dekrementier-Logik und Flip-Flops in ei- 
nem Satz von CI^Blocken ausgefiihrt. Der Datenselektor 3250, der Multiplexer 3220 und der Adressenmultiplexer 3206 
sind jeweils vorzugsweise unter Verwendung einer Datenselektionsschaltung ausgefiihrt, die in einem Satz CL-B16cken 
vorhanden ist. SchlieBlich ist der Schalter 3200 vorzugsweise in der Weise ausgefiihrt, die vorher fur eine Innenschlei- 
fen-ISA beschrieben ist. Der Fachmann erkennt, dafi in bestimmten Anwendungen es vorteilhaft sein kann, eine ISA zu 15 
benutzen, weiche auf einer Innenschleifen-AOU-Konfiguration einer AuBenschleifen-DOU-Konfiguration oder umge- 
kehrt beruht. Beispielsweise wiirde eine assoziative String-Suchvorgang-ISA in vorteilhafter Weise eine Innenschleifen- 
DOU-Konfiguration zusammen mit einer AuBenschleifen-AOU-Konfiguration ausnutzen. Femer wiirde beispielsweise 
eine ISA zum Durchfuhren von Histogramm-Operationen in vorteilhafter Weise eine AuBenschleifen-DOU-Konfigura- 
tion in Verbindung mit einer Innenschleifen-AOU-Konfiguration ausnutzen. 20 

Begrenzte rekonfigurierbare Hardware- Ressourcen miissen zwischen jedem Element der DRPU-Einheit 3032 ange- 
ordnet werden. Da die rekonfigurierbaren Hardware-Ressourcen in ihrer Zahl begrenzt sind, beeinfluBt die Art und 
Weise, in welcher sie der IF-Einheit 3060 beispielsweise zugeordnet werden, den maximalen Rechenleistungspegel, der 
von der DA-Einheit 3062 und der AO-Einheit 3064 erreichbar ist. Die Art und Weise, in welcher die rekonfigurierbaren 
Hardware-Ressourcen zwischen der EF-Einheit 3060, der DO-Einheit 3062 und der AO-Einheit 3064 zugeordnet wer- 25 
den, andert sich entsprechend dem Typ von ISA, der in einem vorgegebenen Moment durchzufuhren ist. Wenn die ISA- 
Komplexitat zunimmt, miissen mehrere konfigurierbare Hardware-Ressourcen der IF-Einheit 3060 zugeordnet werden, 
um zunehmend komplexe Decodier- und Steueroperationen zu vereinfachen, die weniger rekonfigurierbare Hardware- 
Ressourcen iibriglassen, die zwischen der DO-Einheit 3063 und der AO-Einheit 3064 verfugbar sind. Folglich nimmt die 
maximale Rechenleistung, die von der DO-Einheit 3062 und der AO-Einheit 3064 erreichbar ist, mit der ISA-Komple- 30 
xitat ab. Im allgemeinen hat eine AuBenschleifen-ISA viel mehr Befehle als eine Innenschleifen-ISA, und daher ist deren 
Ausfuhrung merklich komplexer hinsichtlich der Decodier- und Steuerschaltung. Beispielsweise wiirde eine AuBen- 
schleifen-ISA, die einen 64 Bit Universalprozessor definiert, viel mehr Befehle haben als eine Innenschleifen-ISA, die 
nur auf eine Datenkompression ausgerichtet ist. 

In Fig. 20A ist ein Diagramm dargestellt, das eine beispielhafte Zuordnung von rekonfigurierbaren Hardware-Res- 35 
sourcen zwischen IF-Einheit 3060, der DO-Einheit 3062 und der AO-Einheit 3064 fur eine AuBenschleifen-IS A zeigt. In 
der beispielhaften Zuordnung der rekonfigurierbaren Hardware-Ressourcen fur die AuBenschleifen-ISA sind der EF-Ein- 
heit 3060, der DO-Einheit 3062 und der AO-Einheit 3064 jeweils annaherend ein Drittel der verfugbaren rekonfigurier- 
baren Hardware-Ressourcen zugeordnet. Fiir den Fall, daB die DRP-Einheit 3032 zu rekonfigurieren ist, um eine Innen- 
schleifen-ISA durchzufuhren, werden weniger rekonfigurierbare Hardware-Ressourcen erfordert, um die EF-Einheit 40 
3060 und die AO-Einheit 3064 infolge der begrenzten Anzahl von Befehlen und Arten von Adressenoperationen auszu- 
fiihren, die von einer Innenschleifen-ISA getragen sind. 

In Fig* 20B ist ein Diagramm dargestellt, das eine beispielhafte Zuordnung von rekonfigurierbaren Hardware-Res- 
sourcen zwischen der IF-Einheit 3060, der DO-Einheit 3062 und der AO-Einheit 3064 fur eine Innenschleifen-ISA zeigt. 
In der beispielhaften Zuordnung von rekonfigurierbaren Hardware-Ressourcen fur die Innenschleifen-ISA ist die EF-Ein- 45 
heit 3060 unter Verwendung von annahernd 5 bis 10% der rekonfigurierbaren Hardware-Ressourcen ausgefiihrt, und die 
AO-Einheit 3064 ist unter Verwendung von annahemd 10 bis 25% der rekonfigurierbaren Hardware-Ressourcen ausge- 
fiihrt. Folglich bleiben etwa 70 bis 80% der rekonfigurierbaren Hardware-Ressourcen verfugbar, um die DO-Einheit 
3062 auszufuhren. Dies wiederum bedeutet, daB der innere Aufbau der DO-Einheit 3062, weiche der Innenschleifen-ISA 
zugeordnet ist, komplexer sein kann und folglich ein deutlich hoheres Leistungsvermogen bietet als der interne Aufbau 50 
der DO-Einheit 3062, weiche der AuBenschleifen-ISA zugeordnet ist. 

Der Fachmann erkennt, daB die DRP-Einheit 3032 entweder die DO-Einheit 3062 oder die AO-Einheit 3064 in einer 
alternativen Ausfuhrungsform enthalten kann. Beispielsweise braucht in einer alternativen Ausfuhrungsform die DRP- 
Einheit 3032 nicht eine AO-Einheit 3064 zu enthalten. Die DO-Einheit 3062 wiirde dann dafiir verantwortlich sein, Ope- 
rationen sowohl bei Daten als auch bei Adressen durchzufuhren. Ungeachtet der besonderen, in Betracht gezogenen 55 
DRPU-Ausfuhrungsform muB eine endliche Anzahl rekonfigurierbarer Hardware-Ressourcen zugeordnet werden, um 
die Elemente der DRPU-Einheit 3032 auszufuhren. Die rekonfigurierbaren Hardware-Ressourcen sind vorzugsweise so 
zugeordnet, daB eine opumale oder beinahe optimale Leistung fur die aktuell in Betracht gezogene ISA relativ zu dem 
Gesamtraum an verfugbaren rekonfigurierbaren Hardware-Ressourcen erreicht wird. 

Der Fachmann erkennt, daB der detaillierte Aufbau des Elements der IF-Einheit 3060, der DO-Einheit 3062 und der 60 
AO-Einheit 3064 nicht auf die vorstehend beschriebenen Ausfiihrungsformen beschrankt ist. Fiir eine vorgegebene ISA 
ist der entsprechende Konfigurations-Datensatz vorzugsweise so definiert, daB der interne Aufbau jedes Elements in der 
EF-Einheit 3060, der DO-Einheit 3062 und der AO-Einheit 3064 eine Rechenleistung relativ zu den verfugbaren rekon- 
figurierbaren Hardware-Ressourcen maximiert. 

In Fig. 21 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer T-Einrichtung 3014 dargestellt. Die T- 65 
Einrichtung 3014 weist eine zweite lokale Zeitbasiseinheit 3300, eine gemeinsame Interface- und Steuereinheit 3302 und 
eine Reihe Verbindungs-Ein/Ausgabeeinheiten 3304 auf. Die zweite lokale Zeitbasiseinheit 3300 hat einen Zeitsteuer- 
eingang, welcher den Master-Zeitsteuereingang der T-Einrichtung bildet. Die gemeinsame Interface-Steuereinheit 3302 
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hat einen Zeitsteuereingang, der mit einem Zeitsteuereingang der zweiten lokalen Zeitbasiseinheit 3300 iiber eine zweite 
Zeitsteuersignalleitung 3310 verbunden ist, einen Adressenausgang, welcher mit der Adressenleitung 3344 verbunden 
ist, einen ersten zweigerichteten Dateneingang, der mit der Speicher-Ein/Ausgabe-Leitung 3044 verbunden ist, einen 
zweigerichteten Steuereingang, der mit einer externen Steuerleitung 3048 verbunden ist, und einen zweiten zweigerich- 

5 teten Dateneingang, der mit einem zweigerichteten Dateneingang jeder vorhandenen Ein/Ausgabeeinheit 3304 iiber eine 
Nachrichteniibertragleitung 3312 verbunden ist. Jede Ein/Ausgabeeinheit 3304 hat einen Eingang, welcher mit der GPI- 
Matrix 3016 iiber eine Nachrichteneingangsleistung 3314 verbunden ist, und einen Ausgang, der mit der GPI-Matrix 
3016 iiber eine Nachrichtenausgangsleitung 3316 verbunden ist 

Die zweite lokale Zeitbasis-Einheit 3300 in der T-Einrichtung 3014 erhalt das Master-Zeitsteuersignal von der Master- 

i o Zeitbasiseinheit 3022 und erzeugt ein zweites lokales ZeitsteuersignaL Die zweite lokale Zeitbasiseinheit 3300 liefert das 
zweite lokale Zeitsteuersignal an die gemeinsame Interface-Steuereinheit 3302, um dadurch eine Zeitsteuerreferenz fiir 
die T-Einrichtung 3040 zu schaffen, in welcher sie untergebracht ist. Vorzugsweise ist die zweite lokale Zeitsteuereinheit 
phasensynchronisiert mit dem Master-Zeitsteuersignal. In dem System 1030 arbeitet jede zweite lokale Zeitbasiseinheit 
3300 der T-Einrichtung vorzugsweise auf derselben Frequenz. Der Fachmann erkennt, daB in einer alternativen Ausfuh- 

15 rungsform ein oder mehrere zweite lokale Zeitbasiseinheiten 3300 auch auf unterschiedlichen Frequenzen arbeiten kon- 
nen. Die zweite lokale Zeitbasiseinheit 3300 ist vorzugsweise mit Hilfe einer herkornrnlichen phasenstarren Frequen- 
zumwandlungsschaltung ausgefiihrt, die eine auf CLB basierende phasenstarre Detektionsschaltung enthalt Der Fach- 
mann erkennt, daB in einer alternativen Ausfuhrungsform die zweite lokale Zeitbasiseinheit 3300 als ein Teil eines Takt- 
verteilungsbaums ausgefiihrt sein konnte. 

20 Die gemeinsame Interface-Steuereinheit 3302 leitet den Nachrichtentransfer zwischen der entsprechenden S-Einrich- 
tung 3012 und einer spezifizierten EhWAusgabeeinheit 3304, wobei eine Nachricht einen Befehl und moglicherweise 
Daten enthalt. In der bevorzugten Ausfuhrungsform kann die spezifizierte Ein/Ausgabeeinheit 3304 in einer T-Einrich- 
tung 3014 oder in einer Ein/Ausgabe-T-Einrichtung 3018 intern oder extern zu dem System 3010 untergebracht sein. In 
der vorliegenden Erfindung ist jede Ein/Ausgabeeinheit 3304 vorzugsweise einer Verbindungsadresse zugeordnet, die 

25 eindeutig die verbindende Ein/Ausgabeeinheit 3304 identifiziert Die Verbindungsadressen fiir die Ein/Ausgabeeinheiten 
3304 in einer vorgegebenen T-Einrichtung werden in dem entsprechenden Architektur-Beschreibungsspeicher 3101 der 
S-Einrichtung gespeichert. 

Die gemeinsame Interface- und Steuereinheit 3302 erhalt Daten und Befehle von der entsprechenden S-Einrichtung 
3012 iiber die Speicher-Ein-/Ausgabeleitung 3064 bzw. die externe Steuersignalleitung 3048. Vorzugsweise enthalt jeder 

30 empfangene Befehl eine Sollkopplungsadresse und einen Befehlscode, welcher eine ganz bestimmte durchzufuhrende 
Operationsart spezifiziert In der bevorzugten Ausfuhrungsform enthalten die Operationsarten, die eindeutig durch Be- 
fehlscodes codiert sind, 1) Datenleseoperationen, 2) Datenschreiboperationen und 3) einen Unterbrechungssignal-Trans- 
fer einschlieBlich eines Rekonfigurations- Unterbrechungstransfers. Die Sollkopplungsadresse identifiziert eine Soll- 
kopplungs- Ein/Ausgabeeinheit 3304, an welcher Daten und Befehle zu iibertragen sind. Vorzugsweise iibertragt die ge- 

35 meinsame Interface-Steuereinheit 3302 jeden Befehl und irgendwelche diesbeziiglichen Daten als einen Satz auf einem 
Datenpaket basierender Nachrichten in herkommlicher Weise, wobei jede Nachricht die Sollkopplungsadresse und den 
Befehlscode enthalt. 

AuBer Daten und Befehle von der entsprechenden S-Einrichtung 3012 zu erhalten, erhalt die gemeinsame Interface- 
und Steuereinheit 3302 Nachrichten von jeder der Ein/Ausgabeeinheit 3304, die mit der Nachrichteniibertragungsleitung 

40 3312 verbunden sind. In der bevorzugten Ausfuhrungsform wandelt die Interface- und Steuereinheit 3302 eine Gruppe 
von diesbeziiglichen Nachrichten in eine einzige Befehls- und Datenfolge um. Wenn der Befehl an die DRP-Einheit 3032 
in der entsprechenden S-Einrichtung 3012 gerichtet ist, gibt die Interface- und Steuereinheit 3302 den Befehl iiber die ex- 
terne Steuersignalleitung 3048 ab. Wenn der Befehl an den Speicher 3034 in der entsprechenden S-Einrichtung 3012 ge- 
richtet ist, gibt die Interface- und Steuereinheit 3302 ein entsprechendes Speichersteuersignal iiber die externe Steuersi- 

45 gnalleitung 3048 und ein Speicheradressensignal iiber die Speicheradressenleitung 3044 ab. Daten werden iiber die Spei- 
cher-Ein/Ausgabeeinheit 3046 iibertragen. In der bevorzugten Ausfuhrungsform weist die Interface- und Steuereinheit 
3302 eine auf CLB basierende Schaltung auf, um Operationen analog denjenigen auszufiihren, die von einer herkornrn- 
lichen SCI-Schalteinheit ausgefiihrt worden sind, die durch ANSI-/IEEE-Norm 1596 bis 1992 definiert ist. 

Jede Ein/Ausgabeeinheit 3304 erhalt Nachrichten von der Interface- und Steuereinheit 3302 und iibertragt Nachrich- 

50 ten an andere Ein/Ausgabeeinheiten 3304 iiber die GPI-Matrix 3016 unter Anweisung von Steuersignalen, die von der 
Interface- und Steuereinheit 3302 erhalten worden sind. In der bevorzugten Ausfuhrungsform basiert die Ein/Ausgabe- 
einheit 3304 auf einem SCI-Knoten, wie er durch ASNI/EEEE-Norm 1596-1 992 definiert ist. In Fig. 22 ist ein Blockdia- 
gramm einer bevorzugten Ausfuhrungsform einer Kopplungs-Ein/Ausgabeeinheit 3304 dargestellt. Die Einheit 3304 
weist einen Adressendecodierer 3320, einen Eingabe- FIFO-Puffer 3322, einen Bypass-FIFO-Puffer 3324, einen Aus- 

55 gangs-FIFO 3326, und einen Multiplexer 3328 auf. Der Adressendecodierer 3320 hat einen Eingang, welcher den Ein- 
gang einer Kopplungs-Ein/Ausgabeeinheit 3304 bildet, einen ersten Ausgang, der mit dem Eingabe-FTFO 3322 verbun- 
den ist, und einen zweiten Ausgang, der mit dem Bypass-FIFO 3324 verbunden ist. Das Eingabe-FTFO 3322 hat einen 
Ausgang, welcher mit der Nachrichtenubertragungsieitung 3312 verbunden ist, um Nachrichten an die gemeinsame In- 
terface- und Steuereinheit 3302 zu iibertragen. Das Ausgangs-FEFO 3326 hat einen Eingang, welcher mit der Nachrich- 

60 teniibertragungsleitung 2312 verbunden ist, um Nachrichten von dem gemeinsamen Interface und einer Steuerschaltung 
3302 zu erhalten, und einen Ausgang, der mit einem ersten Eingang des Multiplexers 3328 verbunden ist. Der Bypass- 
FIFO 3326 hat einen Ausgang, der mit einem zweiten Eingang des Multiplexers 3328 verbunden ist. SchlieBlich hat der 
Multiplexer 3328 einen Steuereingang, welcher mit der Nachrichtenubertragungsieitung 3312 verbunden ist, und einen 
Ausgang, der den Ausgang der Kopplungs-Ein/Ausgabeeinheit bildet 

65 Die Ein/Ausgabeeinheit 3304 erhalt Nachrichten an dem Eingang des Adressen-Decodierers 3312, welcher bestimmt, 
ob die Sollkopplungsadresse, die in der empfangenen Nachricht spezifiziert ist, identisch mit der Kopplungsadresse der 
Kopplungs-Ein/Ausgabeeinheit 3304 ist, in welcher sie untergebracht ist. Wenn dem so ist, leitet der Adressendecodierer 
3320 die Nachricht zu dem Eingabe-FEFO 3322. Anderenfalls leitet der Adressendecodierer 3320 die Nachricht zu dem 
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Bypass-FIFO 3324. In der bevorzugten Ausfuhrungsform weist der Adressen-Decodierer3320 einen Codierer und einen 
Datenselektor auf, die mit Hilfe IOBs und CLBs ausgefiihrt sind. 

In Fig. 23 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform der Ein/Ausgabe-T-Einrichtung 3018 darge- 
stellt. Die Ein/Ausgabe-T-Einrichtung 3018 weist eine dritte lokale Zeitbasiseinheit 3360, eine gemeinsame kundenspe- 
zifische Interface- und Steuereinheit 3362 und eine Kopplungs-Ein/Ausgabeeinheit 3304 auf. Die dritte lokale Zeitbasis- 5 
einheit 3360 hat einen Zeitsteuereingang, welche den Master-Zeitsteuereingang der Ein/Ausgabe-T-Einrichtung 3018 
bildet. Die Ein/Ausgabe-Einheit 3304 hat einen Eingang, welcher mit der GPI-Matrix 3016 iiber eine Nachrichten-Ein- 
gabeleitung 3314 verbunden ist, und einen Ausgang, der mit der GPI-Matrix 3016 uber eine Nachrichtenausgabeleitung 
3316 verbunden ist. Die gemeinsame kundenspezifische Interface- und Steuereinheit 3362 hat vorzugsweise einen Zeit- 
steuereingang, der mit einem Zeitsteuerausgang des dritten lokalen Zeitbasiseinheit 3360 iiber eine dritte Zeitsteuersi- 10 
gnalleitung 3370 verbunden ist, einen ersten zweigerichteten Dateneingang, der mit einem zweigerichteten Datenein- 
gang der Kopplungs-Ein/Ausgabe-Einheit 3304 verbunden ist, und einen Satz Verbindungen zur Ein/Ausgabe-Vorrich- 
tung 3020. In der bevorzugten Ausfuhrungsform enthalt der Satz Verbindungen zu der Ein/Ausgabe-Vorrichtung 3020 
einen zweiten zweigerichteten Dateneingang, der mit einem zweigerichteten Dateneingang der Ein/Ausgabe-\forrich- 
tung 3020 verbunden ist, einen Adressenausgang, der mit einem Adresseneingang der Ein/Ausgabe-Vorrichtung 3020 15 
verbunden ist, und einen zweigerichteten Steuereingang, der mit einem zweigerichteten Steuereingang der Ein/Ausgabe- 
T-Vorrichtung 3020 verbunden ist. Der Fachmann erkennt ohne weiteres, daB die Verbindungen zu der Ein/Ausgabe-Vor- 
richtung 3020 von der Art der Ein/Ausgabe-Vorrichtung 3020 abhangen, mit welcher die gemeinsame kundenspezifische 
Interface- und Steuereinheit 3362 verbunden ist. 

Die dritte lokale Zeitbasiseinheit 3360 erhalt das Master-Zeitsteuersignal von der Master-Zeitsteuereinheit 3025 und 20 
erzeugt ein drittes lokales Zeitsteuersignal. Die dritte lokale Zeitbasiseinheit 3360 gibt das dritte lokale Zeitsteuersignal 
an die Interface- und Steuereinheit 3362 ab, wodurch eine Zeitreferenz fur die Ein/Ausgabe-T-Einrichtung 3018 geschaf- 
fen ist, in welcher sie untergebracht ist. In der bevorzugten Ausfuhrungsform ist das dritte lokale Zeitsteuersignal pha- 
sensynchronisiert mit dem Master-Zeitsteuersignal. Jede dritte lokale Zeitbasiseinheit 3360 der T-Einrichtung arbeitet 
vorzugsweise auf einer identischen Frequenz. In einer alternativen Ausfuhrungsform konnten jedoch auch ein oder mehr 25 
dritte lokale Zeitbasiseinheiten 3360 auf verschiedenen Frequenzen arbeiten. Die dritte lokale Zeitbasiseinheit 3360 ist 
vorzugsweise mit Hilfe einer herkommlichen phasenstarren Frequenzumwandlungsschaltung ausgefiihrt, die eine auf 
CLB basierende phasenstarre Detektionsschaltung enthalt. Analog zu den ersten und zweiten lokalen Zeitbasiseinheiten 
3030 kbnnte auch die dritte lokale Zeitbasiseinheit 3360 als ein Teil eines Taktverteilungsbaums in einer alternativen 
Ausfuhrungsform ausgefiihrt sein. 30 

Der Aufbau und die Funktionalitat der Ein/Ausgabe-Einheit 3304 in der T-Einrichtung 3018 ist vorzugsweise iden- 
tisch mit derjenigen, die vorstehend fur die T-Einrichtung 3014 beschrieben worden ist. Die Ein/Ausgabe-Einheit 3304 
in der T-Einrichtung 3018 ist eine eindeutige Verbindungsadresse analog derjenigen fur jede Verbindungs-Ein/Ausgabe- 
Einheit 3304 in jeder vorgegebenen T-Einrichtung 3014 zugeteilt 

Die gemeinsame kundenspezifische Interface- und Steuereinheit 3362 leitet den Nachrichtentransfer zwischen der 35 
Ein-Ausgabevorrichtung 3020, an welche sie gekoppelt ist, und der Verb indungs-Ein/Ausgabe-Einheit 3304, wobei eine 
Nachricht einen Befehl und moglicherweise Daten enthalt. Die Interface- und Steuereinheit 3362 erhalt Daten und Be- 
fehle von der entsprechenden Ein/Ausgabe-Vorrichtung 3020. Vorzugsweise enthalt jeder Befehl, der von der Ein/Aus- 
gabe-Vorrichtung 3020 empfangen worden ist, eine Sollkopplungsadresse und einen Befehlscode, der eine ganz be- 
stimmte durchzufuhrende Operationsart spezifiziert. In der bevorzugten Ausfuhrungsform enthalten die Operationsarten, 40 
die eindeutig durch Befehlscodes identifiziert sind, 1) Datenanforderung, 2) Datenubertragungsbestatigung und 3) einen 
Unterbrechungssignal-Transfer. Die Sollverbindungsadresse identifiziert eine Sollverbindungs-Ein/Ausgabe-Einheit 
3304 in dem System 3010, in welche Daten und Befehle iibertragen sind. Vorzugsweise ubertragt die gemeinsame Inter- 
face- und Steuereinheit 3062 jeden Befehl und irgendwelche diesbezuglichen Daten als einen Satz auf einem Datenpaket 
basierender Nachrichten in herkomrnlicher Weise, wobei jede Nachricht eine Sollverbindungsadresse und den Befehls- 45 
code enthalt. . 

Zusatzlich zum Empfangen von Daten und Befehlen von der entsprechenden Ein/Ausgabe-\brrichtung 3020 erhalt 
die gemeinsame kundenspezifische Interface- und Steuereinheit 3362 Nachrichten von einer zugeordneten Verbindungs- 
Ein/Ausgabe-Einheit 3304. In der bevorzugten Ausfuhrungsform wandelt die Interface- und Steuereinheit 3363 eine 
Gruppe von verwandten Nachrichten in eine einzige Befehl- und Datenfolge entsprechend den Kommunikationsproto- 50 
kollen, die von der entsprechenden Ein/Ausgabe-Vorrichtung 3020 getragen sind. In der bevorzugten Ausfuhrungsform 
weist die gemeinsame kundenspezifische Interface- und Steuereinheit 3362 eine Steuereinheit fur die auf CLB-basie- 
rende Ein/Ausgabe-Einheit auf, die mit der auf CLB-basierenden Schaltung verbunden ist, um Operationen durchzufuh- 
ren, welche analog denjenigen sind, die von einer herkommlichen SCI-Schalteinheit durchgefuhrt worden sind, wie 
durch ANSI/IEEE-Norm 1596-1992 definiert ist. 55 

Die GPI-Matrix 3016 ist ein herkommliches Verbindungsnetz, welches eine parallele Punkt-zu-Punkt-Nachrichtenlen- 
kung zwischen Verbindungs-Ein/Ausgabe-Einheiten 3304 erleichtert. In der bevorzugten Ausfuhrungsform ist die GPI- 
Matrix 3016 ein auf einer Verdrahtung basierendes, statisches k-nares (k-ary-) Wurfel- Verbindungsnetz. In Fig. 24 ist ein 
Blockdiagramm einer beispielhaften Ausfuhrungsform einer universellen Verbindungs-GPI-Matrix 3016 dargestellt. In 
Fig. 24 ist die Verbindungs-GPI-Matrix 3016 ein toroid- bzw. ringfdrmiges Verbindungsmachennetz, iiber dem entspre- 60 
chend ein k-narer 2 Wurfel, der eine Anzahl erster Ubertragungskanale 3380 und eine Anzahl zweiter Ubertragungska- 
nale 3382 aufweist. Jeder erste Ubertragungskanal 3380 enthalt eine Anzahl Knotenverbindungsstellen 3384, ebenso je- 
der zweite Ubertragungskanal 3382. Jede Verbindungs-Ein/Ausgabeeinheit 3304 in dem System 3010 ist vorzugsweise 
mit der Verbindungs-GPI-Matrix 3014 verbunden, so daB die Nachrichten-Eingangsleitung 3314 und die Nachrichten- 
Ausgangsleitung 3310 aufeinanderfolgende Knotenverbindungsstellen 3384 in einem vorgegebenen ttbertragungskanal 65 
3380, 3382 verbinden. In der bevorzugten Ausfuhrungsform enthalt jede T-Einrichtung 3014 eine Verbindungs-Ein/Aus- 
gabe-Einheit 3304, die mit dem ersten Verbindungskanal 3380 verbunden ist, und eine Verbindungs-Ein-/Ausgabeeinheit 
3304, die mit dem zweiten Verbindungskanal 3382 in der vorstehend beschriebenen Weise verbunden ist. Die gemein- 



31 



DE 198 15 865 A 1 



same Interface- und Steuereinheit 3302 in der T-Einrichtung 3014 erleichtert vorzugsweise das Leiten von Information 
zwischen der mit dem ersten Verbindungskanal verbundenen Ein/Ausgabe-Einheit 3304 und der mit dem zweiten Ver- 
bindungskanal 3382 verbundenen Ein/Ausgabeeinheit 3304. Fiir eine T-Hnrichtung 3014, die eine Verbindungs-Ein/ 
Ausgabe-Einheit 3304 hat, die mit dem ersten als 3380c bezeichneten Ubertragungskanal verbunden ist, und eine Ver- 
5 bindungs-Ein/Ausgabe-Einheit 3304 hat, die mit dem zweiten als 3382c bezeichneten Ubertragungskanal in Fig. 24 ver- 
bunden ist, erleichtert diese gemeinsame Interface- und Steuereinheit 3302 der T-Einrichtung, ein Informationslenken 
zwischen dieser Gruppe von ersten und zweiten Ubertragungskanalen 3380c, 3382c. 

Die Verbindungs-GPI-Matrix 3016 erleichtert folglich das Leiten von vielfachen Nachrichten in paralleler Form zwi- 
schen Verbindungs-Ein/Ausgabeeinheiten 3304. Fiir die zweidimensionale GPI-Matrix 3016, die in Fig. 24 dargestellt 

to ist enthalt jede T-Einrichtung 3014 vorzugsweise eine einzige Verbindungs-Ein/Ausgabe-Einheit 3304 fur den ersten 
Ubertragungskanal 3380 und eine einzige Verbindungs-Ein/Ausgabe-Einheit 3304 fiir den zweiten Verbindungskanal 
3382. Der Fachmann erkennt, daB nur eine Ausfuhrungsform, in welcher die Verbindungs-GPI-Matrix 3016 eine Anzahl 
Dimensionen hat, die groBer als zwei ist, die T-Einrichtung 3014 vorzugsweise mehr als zwei Verbindungs-Ein/Ausgabe- 
Einheiten 3304 enthalt. Vorzugsweise ist die Verbindungs-GPI-Matrix 3016 als eine k-narer 2-Wurfel (k-ary 2-cube) mit 

15 einer 16 BitdatenweggroBe ausgefiihrt. 

In der vorhergehenden Beschreibung sind verschiedene Hemente der vorliegenden Erflndung vorzugsweise unter Ver- 
wendung von rekonfigurierbaren Hardware-Ressourcen ausgefuhrt. Die Hersteller von umprogramrnierbaren Logikvor- 
richtungen stellen iiblicherweise veroffentliche Richtlinien zur Verfiigung, um herkornmliche digitale Hardware mit 
Hilfe von umprogrammierbaren oder rekonfigurierbaren Hardware-Ressourcen auszufuhren. Beispielsweise enthalt das 

20 Xilinx-Buch "Programmierbare Logik-Daten" von 1994 (Xilinx, Inc., San Jose, CA) Anwendungshinweise, wie die fol- 
genden: Anwendungshinweis XAPP 005.002 "Register-Based FIFO"; Anwendungshinweis XAPP 044.00 "High-Perfor- 
mance RAM-Based FIF02 M ; Anwendungshinweis XAPP 013.001, "Using the Dedicated Carry Logic in the XC4000"; 
Anwendungshinweis XAPP 018.000 "Estimating the Performance of XC4000 Adders and Counters", Anwendungshin- 
weis: XAPP 028.001, "Frequency/Phase Comparator for Phase-Locked Loops"; Anwendungshinweis: XAPP3 1.000 

25 "Using the XC4000 RAM Capability", Anwendungshinweis: XAPP 036.001 "Four-Port DRAM Controller . . .", und 
Anwendungshinweis XAPP 039.001 "18-Bit Pipelinded Accumulator". Zusatzliches Material, das von Xilinx veroffent- 
licht worden ist, enthalt Merkmale in "XCELL, The Quaterly Journal for Xilinx Programmable Logic Users". Beispiels- 
weise erscheint ein Artikel, der sich im einzelnen mit der Ausfuhrung schneller ganzzahliger Multiplikatoren befaBt, in 
Ausgabe 14, der Ausgabe vom 3. Quartal 1994. 

30 Das hier beschriebene System 3010 ist eine skalierbare, parallele Computerarchitektur, um dynamisch Mehrfach-ISAs 
auszufuhren. Eine einzelne S-Einrichtung 3012 kann ein ganzes Computerprograrnm selbstandig ablaufen lassen, unab- 
hangig von einer anderen S-Einrichtung 3012 oder von externen Hardware-Ressourcen, wie ein Host-Computer. Auf ei- 
ner einzelnen S-Einrichtung 3012 werden mehrere ISAs zeitlich nacheinander wahrend einer Programmdurchfuhrung 
entsprechend Rekonfigurationsunterbrechungen und/oder ins Programm eingebetteten Rekonfigurationsanweisungen 

35 ausgefuhrt. Da das System 3010 vorzugsweise mehrere S-Einrichtungen 3012 enthalt, werden vorzugsweise mehrere 
Programme gleichzeitig durchgefuhrt, wobei jedes Programm unabhangig sein kann. Folglich werden, da das System 
3010 vorzugsweise mehrere S-Einrichtungen 3012 enthalt, mehrere IS-Architekturen immer gleichzeitig (d. h. parallel) 
auBer wahrend der System- Initialisierung oderRekonfiguration durchgefuhrt. Das heiBt, in einer vorgegebenen Zeit wer- 
den mehrere Satze von Programmbefehlen gleichzeitig durchgefuhrt, wobei jeder Satz von Programmbefehlen gemaB ei- 

40 ner entsprechenden IS-Architektur durchgefuhrt wird. Jede derartige IS-Architektur kann eindeutig sein. 

S-Einrichtungen 3012 kommunizieren miteinander und mit Ein/Ausgabevorrichtungen 3020 uber die Gruppe von T- 
Einrichtungen 3014, die Verbindungs-GPI-Matrix 3016 und jede Ein/Ausgabe-T-Einrichtung 3018. Obwohl jede S-Ein- 
richtung 3012 ein ganzer Computer in sich ist, der in der Lage ist, einen unabhangigen Betrieb durchzufuhren, kann eine 
S-Einrichtung 3012 als eine Master-S-Einrichtung 3012 fur andere S-Einrichtungen 3012 oder das ganze System fungie- 

45 ren, das Daten und/oder Befehle zu anderen S-Einrichtungen 3012, zu einer oder mehreren T-Einrichtungen 3016, einer 
oder mehreren Ein/Ausgabe-T-Einrichtungen 3018 und ein oder mehreren Ein/Ausgabe-Einrichtungen 3022 sendet. 

Das System 3010 gemaB der Erfindung ist folglich insbesondere bei Problemen verwendbar, die sowohl raumlich als 
zeitlich in ein oder mehrere daten-parallele Unterprobleme aufgeteilt werden konnen, beispielsweise in eine Bildverar- 
beitung, eine medizinische Datenverarbeitung, eine kalibrierte Farbanpassung, eine Datenbasis-Berechnung, eine Doku- 

50 menten-Verarbeitung, assoziative Sucheinrichtungen und Netzwerk-Server. Fur Rechenprobleme mit einem grofien Ar- 
ray von Operanden ist eine Daten-Parallelitat vorhanden, wenn Algorithmen angewendet werden konnen, um so eine ef- 
fektive Rechenbeschleunigung durch parallele Rechentechniken anzubieten. Probleme bei der parallelen Datenverarbei- 
tung besitzen eine bekannte Komplexitat, namlich 0(n k ). Der Wert von k ist problem-abhangig, beispielsweise k = 2 fiir 
eine Bildverarbeitung und k = 3 fiir medizinische Datenverarbeitung. Bei der vorliegenden Erfindung werden die einzel- 

55 nen S-Einrichtungen bzw. Gerate 3012 vorzugsweise verwendet, um eine Datenparallelitat auf dem Niveau von Pro- 
grammbefehlsgruppen auszunutzen. Da das System 3010 mehrere S-Einrichtungen 3012 enthalt, wird das System 3010 
vorzugsweise benutzt, um eine Datenparallelitat auf dem Niveau von ganzen Programmsatzen auszunutzen. 

Das System 3010 gemaB der Erfindung sorgt fur sehr viel Rechenleistung, da es in der Lage ist, die Befehls-Verarbei- 
tungshardware in jede S-Einrichtung 3012 vollstandig zu rekonfigurieren, um die Rechenleistung solcher Hardware re- 

60 lativ zu Rechenerfordernissen zu einem vorgegebenen Zeitpunkt zu optimieren. Jede S-Einrichtung 3012 kann unabhan- 
gig von einer anderen S-Einrichtung 3012 rekonfiguriert werden. Das System 3010 behandelt in vorteilhafter Weise je- 
den Konfigurations-Datensatz, und folglich jede IS-Architektur, wie ein programmiertes Interface zwischen Software 
und der hier beschriebenen rekonfigurierbaren Hardware. Die Architektur der vorliegenden Erfindung erleichtert zusatz- 
lich das Strukturieren von rekonfigurierbarer Hardware auf hohem Niveau, um selektiv die Angelegenheiten aktueller 

65 Systeme an Ort und S telle zu adressieren, einschlieBlich Verhalten, bei welchen eine Unterbrechung eine Befehlsverar- 
beitung beeinfluBt, die Notwendigkeit fur eine deterministische Latenzantwort, um eine Echtzeit-Verarbeitung und Steu- 
erfahigkeit zu erleichtern, und die Notwendigkeit fur wahlbare Antworten bei einer Fehler-Behandlung. 

Im Unterschied zu anderen Computer- Architekturen lehrt die vorliegende Erfindung jederzeit die maximale Ausnut- 
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zung von Silizium-Ressourcen. Die vorliegende Erfindung sorgt fiir ein paralleles Computersystem, das jederzeit auf 
jede gewiinschte GroBe vergroBert werden kann, sogar auf Tausende von S-Einrichtungen 12. Eine derartige architekto- 
nische Skalierbarkeit ist moglich, da eine auf S-Geraten basierende Befehlsverarbeitung absichtlich von einer auf T-Ein- 
richtungen basierenden Datenkommunikation getrennt ist. Dieses Paradigma-Befehlsverarbeitung Datenkommunika- 
tion-Trennung ist aufierst giinstig fiir eine parallele Datenberechnung. Der interne Aufbau einer S-Gerate-Hardware ist 5 
vorzugsweise fiir den zeitlichen Durchlauf von. Befehlen optimiert, wahrend der interne Aufbau einer T-Gerate-Hard- 
ware vorzugsweise fiir eine effiziente Datenkommunikation optimiert ist. Die Menge an S-Einrichtungen bzw. -Geraten 
3012 und die Menge an T-Einrichtungen bzw. Geraten sind jeweils eine trennbare, konfigurierbare Komponente in einer 
Raum-Zeitaufteilung einer daten-parallelen Rechenarbeit. 

Mit Hilfe der vorliegenden Erfindung kann zukiinftige rekonfigurierbare Hardware ausgenutzt werden, urn Systeme 10 
mit noch groBeren Rechenkapazitaten zu bauen, wobei der hier beschriebene Gesamtaufbau erhalten bleibt. Mit anderen 
Worten, das System 10 gemaB der Erfindung ist technologisch skalierbar. Praktisch brauchen alle gegenwartig verfugba- 
ren, rekonfigurierbaren Logik-Vorrichtungen auf speicher-basierender CMOS-(Komplementarer Metalloxid-Halblei- 
ter)Technologie. In kiinfugen Systemen wiirde eine rekonfigurierbare logische \forrichtung, die verwendet ist, um eine S- 
Einrichtung auszufiihren, eine Aufteilung von internen Hardware-Ressourcen gemaB den hier beschriebenen Innen- 15 
schleifen- und AuBenschleifen-ISA-Parametriken haben. GroBere rekonfigurierbare logische Vonichtungen bieten ein- 
fach die Moglichkeit, mehr daten-parallele Rechenarbeit in einer einzigen Vorrichtung durchzufuhren. Beispielsweise 
wiirde eine groBere funktionelle Einheit 3194 in der zweiten beispielhaften Ausfuhrungsform der DO-Einheit 3063, wie 
vorstehend anhand von Fig. 17B beschrieben ist, groBere Abbildungs-KerngroBen unterbringen. Der Fachmann erkennt, 
daB die technologische Skalierbarkeit, welche durch die vorliegende Erfindung geschaffen ist, weder auf auf CMOS-ba- 20 
sierende Vorrichtungen noch auf FPGA basierende Ausfiihrungen beschrankt ist Folglich schafft die Erfindung eine 
technologische Skalierbarkeit ungeachtet der speziellen Technologie, die verwendet ist, um eine Rekonfigurierbarkeit 
oder Umprogrammierbarkeit zu schafFen. 

In Fig. 25A und 25B ist ein Ablaufdiagramm eines bevorzugten Verfahrens fiir ein skalierbares, paralleles, dynamisch 
rekonfigurierbares Berechnen dargestellt. Vorzugsweise wird das in Fig. 25 A und 25B dargestellte Verfahren in jeder der 25 
S-Einrichtungen 3012 in dem System 3010 durchgefiihrt. Das bevorzugte Verfahren beginnt beim Schritt 4000 in Fig. 
25A mit der Rekonfigurationslogik 3104, die einen Konfigurations-Datensatz wieder auffindet, der einer ISA entspricht. 
Als nachstes konfiguriert beim Schritt 4002 die Rekonfigurationslogik 3104 jedes Element in der IF-Einheit 3060 der 
DO-Einheit 3062 und der AO-Einheit 3064 entsprechend dem wiederaufgefundenen Konfigurations-Datensatz beim 
Schritt 4002, wodurch eine DRPU-Hardware-Organisation fur die Ausfuhrung der aktueilen in Betracht gezogenen ISA 30 
erzeugt wird. Im AnschluB an den Schritt 4002 findet die Unterbrechungslogik 3106 die Unterbrechungsantwortsignale 
wieder, die in dem Architektur-Beschreibungsspeicher 3101 gespeichert sind, und erzeugt einen entsprechenden Satz 
von Ubergangssteuersignalen, welche fesdegen, wie die aktuelle DRPU-Konfiguration auf Unterbrechungen beim 
Schritt 4004 anspricht. Das ISS 3100 initialisiert anschlieBend beim Schritt 4006 eine Programm-Zustandsinformation, 
worauf das ISS 3100 einen Befehlsausfuhrungszyklus beim Schritt 4008 initialisiert. 35 

Als nachstes bestimmt das ISS 3100 oder die Unterbrechungslogik 3106, ob Rekonfiguration erforderlich ist. Das ISS 
3100 legt fest, daB Rekonfiguration in dem Fall erforderlich ist, daB eine Rekonfigurationsanweisung wahrend einer Pro- 
grammausfuhrung gewahlt wird. Die Unterbrechungslogik 3106 bestimmt, daB Rekonfiguration entsprechend einer Re- 
konfigurations-Unterbrechung erforderlich ist. Wenn Rekonfiguration erforderlich ist, geht das bevorzugte Verfahren auf 
Schritt 4012 iiber, bei welchem ein Rekonfigurauons-Handhabungsprogramm Programmzustandsinformation rettet. 40 
Vorzugsweise enthalt die Programmzustandsinformation eine Referenz zu dem Konfigurationsdatensatz, welcher der ak- 
tueilen DRPU-Konfiguration entspricht. Nach dem Schritt 4012 kehrt das bevorzugte Verfahren auf den Schritt 4000 zu- 
riick, um einen nachsten Konfigurations-Datensatz aufzufinden, auf den durch die Rekonfigurations-Anweisung oder die 
Rekonfigurations-Unterbrechung Bezug genommen ist 

Fur den Fall, daB die Rekonfiguration beim Schritt 4010 nicht erforderlich ist, bestimmt die Unterbrechungslogik 45 
3106, ob eine Nicht-Rekonfigurations-Unterbrechung eine Wartung beim Schritt 4014 erfordert. Wenn dem so ist, be- 
stimmt das ISS 3100 als nachstes beim Schritt 4020, ob ein Zustandsubergang von dem aktueilen ISS-Zustand in dem 
Befehlsausfuhrungszyklus in den Unterbrechungs-Servicezustand basierend auf den Ubergangssteuersignalen zulassig 
ist. Wenn ein Zustandsubergang in den Unterbrechungs-Servicezustand nicht zulassig ist, geht das ISS 3100 in den nach- 
sten Zustand in dem Befehlsausfuhrungszyklus iiber und kehrt auf den Schritt 4020 zuriick. In dem Fall, daB Ubergangs- 50 
steuersignale einen Zustandsubergang von dem aktueilen ISS-Zustand in dem Befehlsausfuhrungszyklus in den Unter- 
brechungs-Servicezustand erlauben, geht ISS 3100 als nachstes beim Schritt 4024 in den Unterbrechungs-Servicezu- 
stand iiber. Beim Schritt 4024 stellt das ISS 3100 eine Programmzustandsinformation sicher und fiihrt Programmbefehle 
fur ein Warten der Unterbrechung aus. Im AnschluB an den Schritt 4024 kehrt das bevorzugte Verfahren auf den Schritt 
4008 zuriick, um den aktueilen Befehlsausfuhrungszyklus wieder aufzunehmen, wenn er noch nicht beendet worden ist, 55 
oder um einen nachsten Befehlsausfuhrungszyklus zu initiieren. 

Fur den Fall, daB keine Nicht- Konfigurations-Unterbrechung eine Wartung beim Schritt 4014 erfordert, geht das be- 
vorzugte Verfahren auf den Schritt 4016 iiber und stellt fest, ob die Durchfuhrung des aktueilen Prograrnms beendet ist. 
Wenn die Durchfuhrung des aktueilen Prograrnms noch andauert, kehrt das bevorzugte Verfahren auf den Schritt 4008 
zuriick, um einen anderen Befehlsausfuhrungszyklus zu initiieren. Andererseits ist das bevorzugte Verfahren beendet. 60 

Die Lehren der vorliegenden Erfindung unterscheiden sich deutlich von anderen Systemen und Verfahren fiir ein um- 
programmierbares oder rekonfigurierbares Rechnen, Insbesondere ist die vorliegende Erfindung nicht Equivalent mit ei- 
ner herunterladbaren Mikrocode-Architektur, da solche Architekturen im allgemeinen auf nicht-rekonfigurierbare Steu- 
ereinrichtung und eine nicht-rekonfigurierbare Hardware angewiesen sind. Die vorliegende Erfindung unterscheidet sich 
also deutlich von einem angeschlossen rekonfigurierbaren Prozessor-(ARP-)System, in welchem eine Gruppe von rekon- 65 
figurierbaren Hardware-Ressourcen mit einem nicht-rekonfigurierbaren Host-Prozessor oder Host-System verbunden 
ist. Die ARP-Einrichtung hangt von dem Host ab, um gewisse Programmbefehle durchzufuhren. Daher wird eine Menge 
verfugbarer Siliziurn-Ressourcen nicht maximal iiber den Zeitrahmen der Programmdurchfuhrung genutzt, da Silizium- 
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Ressourcen bei der ARP-Einrichtung oder dem Host unbenutzt sind oder ineffizient genutzt werden, wenn der Host bzw. 
die ARP-Einrichtung niit Daten arbeitet. ImUnterschied hierzu ist jede S-Einrichtung 3012 ein unabhangiger Rechner, in 
welchem ganze Programme ohne weiteres ausgefuhrt werden konnen. Mehrere S-Einrichtungen 3012 fiihren vorzugs- 
weise gleichzeitig Programme durch. Die vorliegende Erfindung lehrt daher die standige maximale Ausnutzung von Si- 

5 lizium-Ressourcen sowohl fur einzelne Programme, die von einzelnen S-Einrichtungen 3012 durchgefiihrt werden oder 
von mehreren Programmen, die von dem gesamten System 3010 ausgefuhrt werden. 

Eine ARP-Einrichtung stellt einen Rechenbeschleuniger fur einen ganz bestimmten Algorithmus in einer ganz be- 
stimmten Zeit zur Verfugung und ist als ein Satz von Verknupfungsgliedern ausgefuhrt, die optimal beziiglich dieses spe- 
zifischen Algorithmus rniteinander verbunden sind. Die Verwendung von rekonfigurierbaren Hardware-Ressourcen fiir 

10 universelle Operationen, wie eine verwaltende Befehlsausfuhrung, ist bei ARP-System vermieden. Daruber hinaus be- 
handelt ein ARP-System nicht eine vorgegebene Menge von rniteinander verbundenen Verknupfungsgliedern bzw. Gates 
als eine ohne weiteres wiederverwendbare Ressource. Im Gegensatz, die vorliegende Erfindung lehrt eine dynamisch re- 
konfigurierbare Verarbeitungseinrichtung, die fur ein effizientes Management einer Befehlsausfuhrung gemaB einem Be- 
fehlsausfuhrung smodells konfiguriert ist, das am besten fur die Rechenerfordernisse zu einem ganz bestimmten Zeit- 

15 punkt ausgelegt ist. Jede S-Einrichtung 3012 weist eine Vielzahl ohne weiteres wiederverwendbarer Ressourcen, bei- 
spielsweise das ISS 3100, die Unterbrechungslogik 3106 und die Speicher/Ausrichtlogik 3152 auf. Die vorliegende Er- 
findung lehrt die Verwendung von rekonfigurierbaren logischen Ressourcen auf dem Niveau von LCBs- oder IOBs- 
Gruppen und rekonfigurierbarer Verbindungen, jedoch nicht auf dem Niveau von rniteinander verbundenen Gates. Die 
vorliegende Erfindung lehrt folglich die Verwendung von rekonfigurierbaren hoherwertigen logischen Designkonstrakts, 

20 die zum Durchfuhren von Operationen der ganzen Klassen von Rechenproblemen verwendbar sind, und lehrt nicht ein 
brauchbares Verbindungsschema, das fiir einen einzigen Algorithmus verwendbar ist. 

Im allgemeinen sind ARP-Systeme auf ein Ubertragen eines ganz bestimmten Algorithmus in einen Satz von rnitein- 
ander verbundenen Gates gerichtet. Einige ARP-Systeme versuchen, hochwertige Befehle in einer optimalen Hardware- 
Konfiguration zu compilieren, welches im allgemeinen ein hartes NP-Problem ist Im Unterschied hierzu lehrt die Erfin- 

25 dung die Verwendung eines Compilers fur ein dynamisch rekonfigurierbares Berechnen, das hochwertige Programmbe- 
fehle in Assembler-Sprachenbefehle gemaB einer variablen ISA auf sehr unkomplizierte Weise compiliert. 

Eine ARP-Einrichtung ist im allgemeinen nicht in der Lage, ihre eigenes Host-Programm als Daten zu behandeln oder 
es selbst zu kontextualisieren. Im Unterschied hierzu kann jede S-Einrichtung in dem System 3010 ihre eigenen Pro- 
gramme als Daten behandeln, und folglich ohne weiteres selbst kontextualisieren. Das System 3010 kann ohne weiteres 

30 sich selbst durch die Ausfiihrung seiner eigenen Programme simulieren. Die vorliegende Erfindung hat zusatzlich die Fa- 
higkeit, ihren eigenen Compiler zu compilieren. 

In der voriiegenden Erfindung kann ein einziges Programm eine erste Gruppe von Befehlen, die zu einem ersten ISA 
gehoren, eine zweite Gruppe von Befehlen, die zu einer zweiten ISA gehoren, eine dritte Gruppe von Befehlen, die zu 
noch einer weiteren ISA gehoren, usw. enthalten. Die hier beschriebene Architektur fuhrt jede derartige Gruppe von Be- 

35 fehlen rnit Hilfe von Hardware durch, die hinsichtlich Durchlaufzeit konfiguriert ist, um die ISA durchzufuhren, zu wel- 
cher die Befehle gehoren. Keine bekannten Systeme oder Methoden bieten ahnliche Lehren an. 

Die Erfindung lehrt ferner ein rekonfigurierbares Unterbrechungsschema, bei welchem Unterbrechungslatenz, Unter- 
brechungsprazision und ein programmierbares Zustandsiibergangs-Freigeben gemaB der aktuellen, in Betracht gezoge- 
nen ISA sich andem kann. Keine anlogen Lehren werden in anderen Computersystemen gefunden. Die vorliegende Er- 

40 findung lehrt zusatzlich ein Computersystem mit einer rekonfigurierbaren Datenweg-Bitbreite, einer Adressen-Bitbreite 
und rekonfigurierbare Steuerzeilen-Breiten im Unterschied zu herkommlichen Computersystemen. 

Zusammenfassend wurde ein Kompiliersystem und ein Verfahren zur Erzeugung einer Folge von Programmbefehlen 
zur Verwendung in einer dynamisch rekonfigurierbaren Verarbeitungseinheit geschaffen, die eine interne Hardwareorga- 
nisation aufweist, die wahlweise unter einer Anzahl von Hardwarearchitekturen geandert werden kann, wobei jede Hard- 

45 warearchitektur Befehle von einem entsprechenden Befehlssatz ausfuhrt. Quelldateien werden zur Ausfiihrung mit Hilfe 
von mehreren Befehlsatzarchitekturen (instruction set architectures) kompiiiert, wie dies durch Rekonfigurations-Uber- 
setzungsanweisungen spezifiziert wird. Die Objektdateien fassen wahlweise Bitstrdme, die Hardwarearchitekturen spe- 
zifizieren, die Befehlssatzarchitekturen entsprechen, mit ausfuhrbarem Code zur Ausfiihrung auf den Architekturen zu- 
sammen. 

50 
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Fig. 7 
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10 

Patentanspriiche 

1. Kompilierverfahren zur Erzeugung einer Folge von Programmbefehlen zur Verwendung in einer dynamisch re- 
konfigurierbaren Verarbeitungseinheit (10), die eine interne Hardwareorganisation aufweist, die wahrend der Aus- 

15 fiihrung der Folge von Programmbefehlen wahlweise unter einer Anzahl von Hardwarearchitekturen geandert wer- 

den kann, wobei jede HardwarearchitekturBefehle aus einem entsprechenden Befehlssatz ausfiihrt, mit den folgen- 
den Schritten: 

a) als Eingabe wird eine Quelldatei (301) empfangen, die eine Anzahl von Quellcode-Befehlsanweisungen 
enthalt, und zwar einschlieBlich mindestens eines ersten Untersatzes von Befehlsanweisungen und eines zwei- 

20 ten Untersatzes von Befehlsanweisungen; 

b) fur den ersten Untersatz von Befehlsanweisungen wird ein erster Befehlssatz identifiziert; 

c) fur den zweiten Untersatz von Befehlsanweisungen wird ein zweiter Befehlssatz identifiziert; und 

d) der erste Untersatz von Befehlsanweisungen zur Ausfiihrung wird mit Hilfe des ersten Befehlssatzes kom- 
piliert bzw. iibersetzt und der zweite Untersatz von Befehlsanweisungen zur Ausfiihrung wird mit Hilfe des 

25 zweiten Befehlssatzes kompiliert. 

2. Verfahren nach Anspmch 1, fur das 

beim Schritt b) von dem Quellcode eine Rekonfigurations-Betriebsanweisung abgerufen wird, die den ersten Be- 
fehlssatz spezifiziert; und 

beim Schritt c) von dem Quellcode eine Rekonfigurations-Betriebsanweisung abgerufen wird, die den zweiten Be- 
30 fehlssatz spezifiziert. 

3. Verfahren nach Anspruch 2, bei dem jede Rekonfigurations-Betriebsanweisung unter Verwendung einer Meta- 
Syntax bereitgestellt wird. 

4. Verfahren nach Anspruch 2 oder 3, bei dem jede Rekonfigurations-Betriebsanweisung entweder eine Direkt-Re- 
konfigurations-Betriebsanweisung, eine Funktionsebenen-Rekonfigurations-Betriebsanweisung oder eine Stan- 

35 dard-Rekonfigurations-Betriebsanweisung umfaBt. 

5. Verfahren nach einem der vorhergehenden Anspriiche, mit dem weiteren Schritt: 

e) es wird eine ausfuhrbare Datei erzeugt, die die Ergebnisse des Schrittes d) beinhaltet und auBerdem fur je- 
den Untersatz von Befehlsanweisungen einen Rekonfigurationscode, der den Befehlssatz identifiziert, der dem 
Untersatz von Befehlsanweisungen entspricht. 

40 6. Verfahren nach einem der Anspriiche 1 bis 4, mit dem weiteren Schritt: 

e) es wird eine ausfuhrbare Datei erzeugt, die die Ergebnisse des Schrittes d) beinhaltet und auBerdem fiir je- 
den Untersatz von Befehlsanweisungen einen Verweis, der einen Bitstrom bestimmt, der den Befehlssatz dar- 
stellt, der dem Untersatz von Befehlsanweisungen entspricht. 

7. Verfahren nach einem der Anspruche 1 bis 4, mit dem weiteren Schritt: 

45 e) es wird eine ausfuhrbare Datei erzeugt, die die Ergebnisse des Schrittes d) beinhaltet und auBerdem fur je- 

den Untersatz von Befehlsanweisungen einen Verweis, der entsprechend einem erweiterten, ausfuhrbaren Pro- 
gramm und einem Bindungsformat codiert ist, wobei der Verweis einen Bitstrom bestimmt, der den Befehls- 
satz darstellt, der dem Untersatz von Befehlsanweisungen entspricht. 

8. Verfahren nach einem der Anspruche 1 bis 4, mit dem weiteren Schritt: 

50 e) es wird eine ausfuhrbare Datei erzeugt, die die Ergebnisse des Schrittes d) beinhaltet und auBerdem fur je- 

den Untersatz von Befehlsanweisungen einen Bitstrom, der den Befehlssatz darstellt, der dem Untersatz von 
Befehlsanweisungen entspricht. 

9. Verfahren nach einem der Anspruche 1 bis 4, mit den weiteren Schritten: 

e) eine erste Objektdatei wird erzeugt, die die Ergebnisse des Schrittes d) beinhaltet und auBerdem fur jeden 
55 Untersatz von Befehlsanweisungen einen Rekonfigurationscode, der den Befehlssatz identifiziert, der dem Un- 
tersatz von Befehlsanweisungen entspricht; 

f) die Schritte a) bis e) werden mindestens fur eine zweite Quelldatei wiederholt, um mindestens eine zweite 
Objektdatei zu erzeugen; und 

g) die in den Schritten e) und f) erzeugten Objektdateien werden gebunden, um eine ausfuhrbare Datei zu er- 
60 zeugen. 

10. Verfahren nach Anspruch 9, mit dem weiteren Schritt: 

h) an der erzeugten, ausfuhrbaren Datei wird entsprechend den Ausrichtungserfordernissen eine Speicheraus- 
richtung vorgenomrnen. 

11 . Verfahren nach Anspruch 10, bei dem die erzeugte, ausfuhrbare Datei einem Bitstrom zugeordnet ist, der einen 
65 Befehlssatz darstellt, und bei dem der Schritt h) den Schritt umfaBt: 

h.l) der Bitstrom wird aufgefullt, um eine Speicherausrichtung durchzufiihren. 

12. Verfahren nach Anspruch 9, bei dem: 

beim Schritt a) als Eingabe eine Quelldatei empfangen wird, die eine Anzahl von Quellcode-Befehlsanweisungen 
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einschliefilich mindestens eines ersten Untersatzes von Befehlsanweisungen und eines zweiten Untersatzes von Be- 
fehlsanweisungen enthalt, wobei zuniindest eine der Befehlsanweisungen einen externen Verweis enthalt; und 
beim Schritt e) eine erste Objektdatei erzeugt wird, die die Ergebnisse des Schrittes d) enthalt und auBerdem fur je- 
den Untersatz von Befehlsanweisungen einen Rekonfiguradonscode, der den Befehlssatz identifiziert, der dem Un- 
tersatz von Befehlsanweisungen entspricht, wobei zumindest eine der Befehlsanweisungen einen externen \ferweis 5 
enthalt; und 

mit dem weiteren Schritt: 

f.l) vor der Ausfuhrung des Schrittes g) werden fiir jede Objektdatei die externen Verweise aufgelost. 

13. Verfahren nach einem der vorhergehenden Anspriiche, bei dem der erste Untersatz von Befehlsanweisungen 
eine erste definierte Funkdon und der zweite Untersatz von Befehlsanweisungen eine zweite definierte Funktion 10 
umfaBt. 

14. Verfahren nach einem der Anspriiche 1 bis 13, bei dem der erste Untersatz von Befehlsanweisungen einen er- 
sten beliebigen Block von Anweisungen und der zweite Untersatz von Befehlsanweisungen einen zweiten beliebi- 
gen Block von Anweisungen umfaBt 

15. Verfahren nach Anspruch 14, bei dem die Quelldatei mindestens einen Funktionsaufruf und einen Funkuons- 15 
riicksprung umfaBt und bei dem die Schritte b) und c) jeweils die wahlweise Ausfuhrung einer interprozeduralen 
Analyse umfassen, um bei jedem Funkuonsaufruf und bei jedem Funktionsrucksprung eine im Kontext beflndliche 
Befehlsatzarchitektur (ISA) zu identifizieren. 

16. Verfahren nach Anspruch 1, mit den weiteren Schritten: 

e) der erste kompilierte Untersatz von Befehlsanweisungen wird fur den ersten Befehlssatz optimiert; und 20 

f) der zweite kompilierte Untersatz von Befehlsanweisungen wird fur den zweiten Befehlssatz optimiert. 

17. Kompilierverfahren zur Erzeugung einer Folge von Programmbefehlen zur Verwendung in einer dynamisch re- 
konfigurierbaren Verarbeitungseinheit, die eine interne Hardwareorganisation aufweist, die wahrend der Ausfuh- 
rung der Folge von Programmbefehlen unter einer Anzahl von Hardwarearchitekturen verandert werden kann, wo- 
bei jede Hardwarearchitektur Befehle von einem entsprechenden Befehlssatz ausfuhrt, mit den folgenden Schritten: 25 

a) eine Quellcode-Befehlsanweisung wird von einer Quelldatei ausgewahlt, die eine Anzahl von Quellcode- 
Befehlsanweisungen enthalt; 

b) in Antwort auf die Anweisung, die einen Funktionsaufruf umfaBt, werden die folgenden Schritte ausge- 
fuhrt: 

b.l) ein erster Befehlssatz; der augenblicklich im Kontext stent, wird besdmmt; 30 
b.2) ein zweiter Befehlssatz ftir den Funktionsaufruf wird besdmmt; 

b.3) in Antwort darauf, daB der erste Befehlssatz von dem zweiten Befehlssatz abweicht, werden die fol- 
genden Schritte ausgefuhrt: 

b.3.1) Codeanweisungen zur Rekonfiguration werden an den zweiten Befehlssatz abgegeben; 
b.3.2) fur den Funktionsaufruf wird eine kompilierte Codeanweisung abgegeben; und 35 
b.3. 3) zur Rekonfiguradon werden an den ersten Befehlssatz Codeanweisungen abgegeben; und 
b.4) in Antwort darauf, daB die erste Befehlsatzarchitektur idendsch zu dem zweiten Befehlssatz ist, wird 
fur den Funkuonsaufruf eine kompilierte Codeanweisung abgegeben; 

c) in Antwort darauf, daB die Anweisung keinen Funkuonsaufruf umfaBt, wird fur die Anweisung eine kom- 
pilierte Codeanweisung abgegeben; und 40 

d) die Schritte a) bis c) werden fiir jede Quellcode-Befehlsanweisung in der Quelldatei wiederholt. 

18. Verfahren nach Anspruch 17, bei dem der Schritt b.3.1) die folgenden Schritte umfaBt: 
b.3.1. 1.) es wird eine Codeanweisung zum Retten von lebenden Registem abgegeben; und 

b.3. 1.2) es wird eine Rekonfigurations-Codeanweisung abgegeben; und bei dem der Schritt b.3.3) die folgen- 
den Schritte umfaBt: 45 
b.3. 3.1) es wird eine Rekonfigurations-Codeanweisung abgegeben; und 

b.3.3.2) es wird eine Codeanweisung zur Wiederherstellung der geretteten, lebenden Register abgegeben. 

19. Verfahren nach Anspruch 18, bei dem die Codeanweisungen Registertransferebenenanweisungen (KTL- An- 
weisungen) umfassen. 

20. Verfahren nach Anspruch 19, mit den weiteren Schritten: 50 

e) eine Register- bzw. Speicherreservierung wird durchgefuhrt; 

f) fiir jede Registertransferebenenanweisung wird: 

f.l) besdmmt, ob fur die Registertransferebenenanweisung eine Obersetzungsregel exisdert; und 

f.2) in Antwort auf die Feststellung, daB eine Obersetzungsregel exisdert, wird fiir die Registertransfer- 

ebenenanweisung entsprechend der tjbersetzungsregel ein Assemblercode erzeugt. 55 

21. Verfahren nach Anspruch 19, mit den weiteren Schritten: 

e) jede Registertransferebenenanweisung wird mit Bemerkungen versehen, um eine Befehlsatzarchitektur 
(ISA) anzugeben; 

f) die Registertransferebenenanweisungen werden opdmiert; und 

g) aus den opdmierten Registertransferebenenanweisungen wird ein maschinenabhangiger Assemblercode er- 60 
zeugt. 

22. Verfahren zur Rekonfigurierung einer dynamisch rekonfigurierbaren Verarbeitungseinheit wahrend der Aus- 
fuhrung eines Programms, das eine Folge von Programmbefehlen umfaBt, mit den folgenden Schritten: 

a) es wird eine Rekonfigurations-Betriebsanweisung identifiziert, die einen neuen Befehlssatz spezifiziert; 

b) ein Zustand der Programmausfuhrung wird gespeichert; 65 

c) der neue Befehlssatz wird geladen; 

d) der gespeicherte Zustand der Programmausfuhrung wird wieder abgerufen; und 

e) die Ausfuhrung wird unter Verwendung des neuen Befehlssatzes wieder aufgenommen. 
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23. Veifahren nach Anspruch 22, bei dem der Schritt b) die folgenden Schritte umfaBt: 

b.l) Zustandsvariablen werden auf einem Stapel gespeichert, auf den rnit Hilfe eines Stapelzeigers (SP) ver- 
wiesen wird; und 

b.2) der Stapelzeiger wird in einer Speicherstelle abgespeichert; und bei dem der Schritt d) die Schritte umfaBt: 
5 d.1) der Stapelzeiger wird von der Speicherstelle wieder abgerufen; und 

d.2) die Zustandsvariablen werden von dem Stapel wieder abgerufen. 

24. Kompiliersystern zur Erzeugung einer Folge von Programmanweisungen zur Verwendung in einer dynamisch 
rekonfigurierbaren Verarbeitungseinheit, die eine interne Hardwareorganisation aufweist, die wahrend der Ausfiih- 
rung der Folge von Programmanweisungen unter einer Anzahl von Hardwarearchitekturen geandert werden kann, 

10 wobei jede Hardwarearchitektur Befehle von einem entsprechenden Befehlssatz ausfuhrt, welches Kompiliersy- 

stern umfaBt: 

a) ein Eingabegerat zur Eingabe von rnindestens einer Quelldatei, die eine Anzahl von Quellcode-Befehlsan- 
weisungen enthalt, und zwar einschlieBlich von rnindestens einem ersten Untersatz von Befehlsanweisungen, 
einem zweiten Untersatz von Befehlsanweisungen, sowie fiir jeden Untersatz von Befehlsanweisungen eine 

15 Rekonfigurations-Betriebsanweisung, die eine der Hardwarearchitekturen spezifiziert; und 

b) einen Kompiler, der verbunden ist, um von dem Eingabegerat jede Quelldatei zu empfangen, zur Kompi- 
lierung jeder Eingabe-Quelldatei, um eine Objektdatei zu erzeugen, indem der Befehlssatz, der der von jeder 
Rekonfigurations-Betriebsanweisung spezifizierten Hardwarearchitektur entspricht, identifiziert wird, indem 
rnindestens ein Abschnitt der Eingabe-Quelldatei zur Ausfiihrung unter Verwendung jedes identifizierten Be- 

20 fehlssatzes kompiliert wird, und indem ein Rekonfigurationscode erzeugt wird, der jeder Rekonfigurations-Be- 

triebsanweisung entspricht. 

25. Kompiliersystern nach Anspruch 24, das auBerdem umfaBt: 

einen Binder bzw. Linker, der verbunden ist, um jede Objektdatei zu empfangen, zur Verknupfung der Objektda- 
teien, um eine ausfuhrbare Datei zu erzeugen, die fiir jede Rekonfigurations-Betriebsanweisung einen Verweis auf 
25 einen Bitstrom enthalt, der die durch die Rekonfigurations-Betriebsanweisung spezifizierte Hardwarearchitektur 

beschreibt, sowie eine Folge von Programmanweisungen fur die beschriebene Hardwarearchitektur. 

26. Kompiliersystern nach Anspruch 24, das auBerdem umfaBt: 

einen Binder bzw. Linker, der verbunden ist, um jede Objektdatei zu empfangen, zur Verknupfung der Objektda- 
teien, um eine ausfuhrbare Datei zu erzeugen, die fur jede Rekonfigurations-Betriebsanweisung einen Bitstrom ent- 
30 halt, der die von der Rekonfigurations-Betriebsanweisung spezifizierte Hardwarearchitektur beschreibt, sowie eine 

Folge von Programmbefehlen fur die beschriebene Hardwarearchitektur. 

27. Computerprogrammprodukt, das ein computerverwendbares Medium umfaBt, auf dem ein computerlesbarer 
Code verkorpert ist, zur Erzeugung einer Folge von Programmbefehlen zur Verwendung in einer dynamisch rekon- 
figurierbaren Verarbeitungseinheit, welche umfaBt: 

35 a) Gerate fiir computerlesbaren Programmcode, die ausgelegt sind, um als Eingabe eine Quelldatei zu emp- 

fangen, die eine Anzahl von Quellcode-Befehlsanweisungen enthalt, einschlieBlich rnindestens eines ersten 
Untersatzes von Befehlsanweisungen und eines zweiten Untersatzes von Befehlsanweisungen; 
b) Gerate fur computerlesbaren Programmcode, die konfiguriert sind, um einen ersten Befehlssatz fiir den er- 
sten Untersatz von Befehlsanweisungen zu identifizieren; 

40 c) Gerate fur computerlesbaren Programmcode, die konfiguriert sind, um einen zweiten Befehlssatz fiir den 

zweiten Untersatz von Befehlsanweisungen zu identifizieren; und 

d) Gerate fiir computerlesbaren Programmcode, die konfiguriert sind, um den ersten Untersatz von Befehlsan- 
weisungen zur Ausfiihrung unter Verwendung des ersten Befehlssatzes zu kompilieren und um den zweiten 
Untersatz von Befehlsanweisungen zur Ausfiihrung unter Verwendung des zweiten Befehlssatzes zu kompilie- 
45 ren. 

28. Computerprogrammprodukt nach Anspruch 27, das auBerdem umfaBt: 

Gerate fiir computerlesbaren Programmcode, die konfiguriert sind, um eine ausfuhrbare Datei zu erzeugen, welche 
die kompilierten Anweisungen enthalt und auBerdem fur jeden Untersatz von Befehlsanweisungen einen Rekonfi- 
gurationscode, der den Befehlssatz identifiziert, der dem Untersatz von Befehlsanweisungen entspricht. 
50 29. Computerprogrammprodukt nach Anspruch 27, das auBerdem umfaBt: 

Gerate fiir computerlesbaren Programmcode, die konfiguriert sind, um eine ausfuhrbare Datei zu erzeugen, welche 
die kompilierten Anweisungen enthalt und auBerdem fur jeden Untersatz von Befehlsanweisungen einen Verweis, 
der einen Bitstrom bezeichnet, der den Befehlssatz darstellt, der dem Untersatz von Befehlsanweisungen entspricht. 

30. Computerprogrammprodukt nach Anspruch 27, das auBerdem umfaBt: 

55 Gerate fur computerlesbaren Programmcode, die konfiguriert sind, um eine ausfuhrbare Datei zu erzeugen, die die 

kompilierten Anweisungen enthalt und auBerdem fur jeden Untersatz von Befehlsanweisungen einen Verweis, der 
entsprechend einem erweiterten ausfuhrbaren Programm und einem Bindeformat codiert ist, wobei der Verweis ei- 
nen Bitstrom bezeichnet, der den Befehlssatz darstellt, der dem Untersatz von Befehlsanweisungen entspricht. 

31. Computerprogrammprodukt nach Anspruch 27, das auBerdem umfaBt: 

60 Gerate fur computerlesbaren Programmcode, die konfiguriert sind, um eine ausfuhrbare Datei zu erzeugen, die die 

kompilierten Anweisungen enthalt und auBerdem fiir jeden Untersatz von Befehlsanweisungen einen Bitstrom, der 
den Befehlssatz darstellt, der dem Untersatz von Befehlsanweisungen entspricht 

32. Computerprogrammprodukt nach Anspruch 27, das auBerdem umfaBt: 

a) Gerate fur computerlesbaren Programmcode, die konfiguriert sind, um eine erste Objektdatei zu erzeugen, 
65 welche die kompilierten Anweisungen enthalt, und auBerdem fiir jeden Untersatz von Befehlsanweisungen ei- 
nen Rekonfigurationscode, der den Befehlssatz identifiziert, der dem Untersatz von Befehlsanweisungen ent- 
spricht; 

b) Gerate fur computerlesbaren Programmcode, die konfiguriert sind, um rnindestens eine zweite Objektdatei 
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zu erzeugen; und 

c) Gerate fiir computerlesbaren Prograrnrncode, die konfiguriert sind, um die erzeugten Objektdateien zu bin- 
den, die erzeugt wurden, um eine ausfuhrbare Datei zu erzeugen. 
33. Computerprogrammprodukt nach Anspruch 32, das auBerdem Gerate fiir computerlesbaren Programmcode 
umfafit, die konfiguriert sind, um auf der erzeugten ausfuhrbaren Datei entsprechend den Ausrichtungserfordemis- 
sen eine Speicherausrichtung vorzunehmen. 



Hierzu 37 Seite(n) Zeichnungen 
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